groesse04

bayes
regression
paper
Published

November 27, 2024

Aufgabe

Hintergrund und Forschungsfrage

Wir interessieren uns für die typische Körpergröße deutscher Studentis. Hier findet sich dazu der Datensatz wo_men.

Wir wollen die Forschungsfrage untersuchen, wie groß deutsche Studentis im Schnitt sind.

Diese Verteilung (typische Körpergröße erwachsener Männer) nehmen wir an mit \(\mu \sim N(178.4, 7.6)\).

Quelle: Körpergröße Männer

Siehe auch hier zur Körpergröße der Männer

Aufgabe: Wie breit ist das 95%-ETI für die Körpergröße der (männlichen) Studenten (in der Post-Verteilung)? Geben Sie die Zahl in Zentimetern an!

Hinweise:

  • Verwenden Sie die Daten wie in dieser Aufgabe angegeben.
  • Beachten Sie die üblichen Hinweise des Datenwerks.

Setup

library(pradadata)  # für den Datensatz `wo_men`
library(tidyverse)
library(ggpubr)
library(rstanarm)
library(easystats)

Daten der Stichprobe

Daten importieren:

data(wo_men)

Mittelwert in der Stichprobe:

men <- 
wo_men |> 
  filter(height < 210, height > 150) |> 
  filter(sex == "man") |> 
  drop_na()

men |>  
  summarise(height_avg = mean(height, na.rm = TRUE),
            height_sd = sd(height, na.rm = TRUE))
height_avg height_sd
183.1111 9.958082
men |> 
  ggdensity(x = "height", fill = "sex")

Hm, ob da alle Männer ihre Größe korrekt angegeben haben?

Modell

m1 <- stan_glm(height ~ 1, data = men,
               refresh = 0,
               prior_intercept = normal(178.4, 7.6),
               prior_aux = exponential(0.125))

Modellparameter:

Parameter Median 95% CI pd Rhat ESS Prior
(Intercept) 182.65 (178.01, 187.25) 100% 1.002 1972.00 Normal (178.40 +- 7.60)

Visualisierung der Post-Verteilung (HDI, 95%):

Hinweise:











Lösung

Die Breite des 95%-ETI für die Körpergröße der Studenten beträgt:

[1] 9.235117

Zu diesem Wert kommt man, wenn man in der Tabelle der Post-Verteilung die Differenz der beiden Werte in der Spalte 95% CI berechnet (für die Zeile (Intercept)).