Bed-Post-Wskt1

regression
bayes
post
Published

December 9, 2022

Exercise

Beziehen Sie sich auf das Regressionsmodell, für das die Ausgabe mit stan_glm() hier dargestellt ist:

Parameter Median CI CI_low CI_high pd Rhat ESS Prior_Distribution Prior_Location Prior_Scale
(Intercept) 146.1050983 0.95 145.1605321 147.075639 1 0.9997636 4475.401 normal 154.5971 19.355830
weight_c 0.9034848 0.95 0.8201613 0.984254 1 0.9998113 4535.592 normal 0.0000 2.997786

Betrachten Sie folgende Beziehung (Gleichung bzw. Ungleichung):

\[Pr(\text{height}_i = 155|\text{weightcentered}_i=10, \alpha, \beta, \sigma) \quad \Box \quad Pr(\text{height}_i = 160|\text{weightcentered}_i=10, \alpha, \beta, \sigma)\] Die in der obigen Beziehung angegebenen Parameter beziehen sich auf das oben dargestellt Modell.

Ergänzen Sie das korrekte Zeichen in das Rechteck \(\Box\)!

Answerlist

  • \(\lt\)
  • \(\le\)
  • \(\gt\)
  • \(\ge\)
  • \(=\)











Solution

Als Prädiktorwert (X-Variable) wurde der Achsenabschnitt spezifiziert, also \(x=10\). Der Achsenabschnitt wird mit 146.11 angegeben. Je weiter ein \(y_i\) vom vorhergesagten Wert, \(\hat{y}\) entfernt ist, desto unwahrscheinlicher ist es, gegeben dem Prädiktorwert und dem Modell und den Daten. Für jede Einheit von \(X\) wird \(Y\) größer, also weiter weg von Null.

Der vorhergesagte Wert \(\hat{y}\) lässt sich aus der Tabelle mit den Parameterwerten berechnen:

\(\hat{y} = \beta_0 + x \cdot \beta_1\)

Für das vorliegende Beispiel heißt das:

\(\hat{y} = 146.11 + 10 \cdot 0.9\).

Das Ergebnis ist:

(Intercept) 
     155.11 

Im Detail:

Pakete starten:

library(rstanarm)
library(tidyverse)
library(easystats)

Daten importieren:

Kung_path <-  
  "https://raw.githubusercontent.com/sebastiansauer/Lehre/main/data/Howell1a.csv"  

d <- read.csv(Kung_path) 

Daten zentrieren:

d <-
  d |> mutate(weight_c = weight - mean(weight))

Nur Erwachsene:

d <-
  d |> 
  filter(age >= 18)

Modell berechnen:

mod <- stan_glm(height ~ weight_c, data = d, refresh = 0)

Paramter des Modells:

parameters(mod)
Parameter Median CI CI_low CI_high pd Rhat ESS Prior_Distribution Prior_Location Prior_Scale
(Intercept) 146.1050983 0.95 145.1605321 147.075639 1 0.9997636 4475.401 normal 154.5971 19.355830
weight_c 0.9034848 0.95 0.8201613 0.984254 1 0.9998113 4535.592 normal 0.0000 2.997786

Modell visualisieren:

estimate_relation(mod) |> plot()

Wie man im Diagramm sieht, ist die Wahrscheinlichkeit bei x = 10 für y=155 größer als für y=160.

Die Wahrscheinlichkeit für einen bestimmten Y-Wert gegeben x = 10` ist auf der Regressionsgeraden am größten (blauer Punkt). Die Punkte auf der Regressionsgeraden sind die vorhergesagten Y-Wert (\(\hat{y}\)) für die gegebenen X-Werte.

Answerlist

  • Falsch
  • Falsch
  • Wahr
  • Falsch
  • Falsch

Categories:

  • regression
  • bayes
  • post