fofrage-regrformel2

bayes
regression
paper
Published

January 3, 2025

1 Aufgabe

Betrachten Sie folgende Forschungsformel:

Gibt es einen Interaktionseffekt zwischen Geschlecht und Schnabellänge auf das Gewicht eines Pinguins? Liegen auch Haupteffekte vor?

Aufgabe: Auf Basis der folgenden Analyse ist folgende Frage zu untersuchen. Liegt ein Interaktionseffekt vor?

Hinweise:

  • Unter “Haupteffekt” versteht man den Effekt einer UV auf die AV (im Gegensatz zu einem Interaktionseffekt, der ja der gemeinsame Effekt mehrerer UV auf die AV ist).
  • Beachten Sie die üblichen Hinweise des Datenwerks.
  • Beziehen Sie sich auf den Datensatz penguins.
library(palmerpenguins)
library(tidyverse)
data(penguins)

penguins <-
  penguins |> 
  filter(sex == "female" | sex == "male") |> 
  drop_na()
library(easystats)
library(tidyverse)
library(rstanarm)
glimpse(penguins)
Rows: 333
Columns: 8
$ species           <fct> Adelie, Adelie, Adelie, Adelie, Adelie, Adelie, Adel…
$ island            <fct> Torgersen, Torgersen, Torgersen, Torgersen, Torgerse…
$ bill_length_mm    <dbl> 39.1, 39.5, 40.3, 36.7, 39.3, 38.9, 39.2, 41.1, 38.6…
$ bill_depth_mm     <dbl> 18.7, 17.4, 18.0, 19.3, 20.6, 17.8, 19.6, 17.6, 21.2…
$ flipper_length_mm <int> 181, 186, 195, 193, 190, 181, 195, 182, 191, 198, 18…
$ body_mass_g       <int> 3750, 3800, 3250, 3450, 3650, 3625, 4675, 3200, 3800…
$ sex               <fct> male, female, female, female, male, female, male, fe…
$ year              <int> 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007…

Zur besseren Interpretierbarkeit sind die metrischen UV standardisiert:

penguins_z <- standardize(penguins, select = bill_length_mm, append = TRUE)

Es werden verschiedenen Modelle berechnet, die sich in ihrem Regressionsformel unterscheiden:

m1 <- stan_glm(body_mass_g ~ sex, data = penguins_z, 
               refresh = 0)
m2 <- stan_glm(body_mass_g ~ sex + bill_length_mm_z, data = penguins_z, 
               refresh = 0)
m3 <- stan_glm(body_mass_g ~ sex + bill_length_mm_z + sex:bill_length_mm_z, data = penguins_z, 
               refresh = 0)
m4 <- stan_glm(body_mass_g ~ sex:bill_length_mm_z, data = penguins_z, 
               refresh = 0)

Parameter m1:

Parameter Median 95% CI pd Rhat ESS Prior
(Intercept) 3861.21 (3745.63, 3973.96) 100% 1.001 3121 Normal (4207.06 +- 2013.04)
sexmale 684.79 (521.95, 844.69) 100% 1.000 3190 Normal (0.00 +- 4020.19)

Parameter m2:

Parameter Median 95% CI pd Rhat ESS Prior
(Intercept) 4002.60 (3912.36, 4102.96) 100% 1.000 4254 Normal (4207.06 +- 2013.04)
sexmale 403.34 (260.30, 541.65) 100% 0.999 3949 Normal (0.00 +- 4020.19)
bill_length_mm_z 406.25 (332.64, 477.73) 100% 1.000 4141 Normal (0.00 +- 2013.04)

Parameter m3:

Parameter Median 95% CI pd Rhat ESS Prior
(Intercept) 4010.11 (3906.37, 4116.00) 100% 1.000 3304 Normal (4207.06 +- 2013.04)
sexmale 405.27 (269.24, 546.89) 100% 1.000 3311 Normal (0.00 +- 4020.19)
bill_length_mm_z 430.63 (321.98, 539.70) 100% 1.001 2634 Normal (0.00 +- 2013.04)
sexmale:bill_length_mm_z -48.95 (-192.57, 100.67) 73.70% 1.000 2759 Normal (0.00 +- 2809.11)

Parameter m4:

Parameter Median 95% CI pd Rhat ESS Prior
(Intercept) 4217.45 (4146.73, 4289.31) 100% 1.000 5413 Normal (4207.06 +- 2013.04)
sexfemale:bill_length_mm_z 508.24 (403.39, 610.12) 100% 1.000 4595 Normal (0.00 +- 3079.61)
sexmale:bill_length_mm_z 445.28 (344.70, 545.89) 100% 1.000 5083 Normal (0.00 +- 2809.11)













2 Lösung

Die Regressionsformel lautet: body_mass_g ~ sex + bill_length_mm + sex:bill_length_mm.

Daher ist m3 korrekt.

Die Parameterwerte von m3 zeigen, dass ein Interaktionseffekt nicht bestätigt werden kann, bzw. dass die Null, also keine Interaktion, im Bereich plausibler Werte (d.h. innerhalb des Konfidenzintervalls) liegt.