Parameter | Median | CI | CI_low | CI_high | pd | Rhat | ESS | Prior_Distribution | Prior_Location | Prior_Scale |
---|---|---|---|---|---|---|---|---|---|---|
(Intercept) | 146.1050983 | 0.95 | 145.1605321 | 147.075639 | 1 | 0.9997636 | 4475.401 | normal | 154.5971 | 19.355830 |
weight_c | 0.9034848 | 0.95 | 0.8201613 | 0.984254 | 1 | 0.9998113 | 4535.592 | normal | 0.0000 | 2.997786 |
Bed-Post-Wskt1
Exercise
Beziehen Sie sich auf das Regressionsmodell, für das die Ausgabe mit stan_glm()
hier dargestellt ist:
Betrachten Sie folgende Beziehung (Gleichung bzw. Ungleichung):
\[Pr(\text{height}_i = 155|\text{weightcentered}_i=10, \alpha, \beta, \sigma) \quad \Box \quad Pr(\text{height}_i = 160|\text{weightcentered}_i=10, \alpha, \beta, \sigma)\] Die in der obigen Beziehung angegebenen Parameter beziehen sich auf das oben dargestellt Modell.
Ergänzen Sie das korrekte Zeichen in das Rechteck \(\Box\)!
Answerlist
- \(\lt\)
- \(\le\)
- \(\gt\)
- \(\ge\)
- \(=\)
Solution
Als Prädiktorwert (X-Variable) wurde der Achsenabschnitt spezifiziert, also \(x=10\). Der Achsenabschnitt wird mit 146.11 angegeben. Je weiter ein \(y_i\) vom vorhergesagten Wert, \(\hat{y}\) entfernt ist, desto unwahrscheinlicher ist es, gegeben dem Prädiktorwert und dem Modell und den Daten. Für jede Einheit von \(X\) wird \(Y\) größer, also weiter weg von Null.
Der vorhergesagte Wert \(\hat{y}\) lässt sich aus der Tabelle mit den Parameterwerten berechnen:
\(\hat{y} = \beta_0 + x \cdot \beta_1\)
Für das vorliegende Beispiel heißt das:
\(\hat{y} = 146.11 + 10 \cdot 0.9\).
Das Ergebnis ist:
(Intercept)
155.11
Im Detail:
Pakete starten:
library(rstanarm)
library(tidyverse)
library(easystats)
Daten importieren:
<-
Kung_path "https://raw.githubusercontent.com/sebastiansauer/Lehre/main/data/Howell1a.csv"
<- read.csv(Kung_path) d
Daten zentrieren:
<-
d |> mutate(weight_c = weight - mean(weight)) d
Nur Erwachsene:
<-
d |>
d filter(age >= 18)
Modell berechnen:
<- stan_glm(height ~ weight_c, data = d, refresh = 0) mod
Paramter des Modells:
parameters(mod)
Parameter | Median | CI | CI_low | CI_high | pd | Rhat | ESS | Prior_Distribution | Prior_Location | Prior_Scale |
---|---|---|---|---|---|---|---|---|---|---|
(Intercept) | 146.1050983 | 0.95 | 145.1605321 | 147.075639 | 1 | 0.9997636 | 4475.401 | normal | 154.5971 | 19.355830 |
weight_c | 0.9034848 | 0.95 | 0.8201613 | 0.984254 | 1 | 0.9998113 | 4535.592 | normal | 0.0000 | 2.997786 |
Modell visualisieren:
estimate_relation(mod) |> plot()
Wie man im Diagramm sieht, ist die Wahrscheinlichkeit bei x = 10
für y=155
größer als für y=160
.
Die Wahrscheinlichkeit für einen bestimmten Y-Wert gegeben x = 10` ist auf der Regressionsgeraden am größten (blauer Punkt). Die Punkte auf der Regressionsgeraden sind die vorhergesagten Y-Wert (\(\hat{y}\)) für die gegebenen X-Werte.
Answerlist
- Falsch
- Falsch
- Wahr
- Falsch
- Falsch
Categories:
- regression
- bayes
- post