kollision-eignung

causal
Published

December 19, 2023

Aufgabe

Sagen wir, über die Eignung, e, für ein Studium würden nur (die individuellen Ausprägungen) von Intelligenz (iq) und Fleiss (fleiss) entscheiden, s. den DAG in Figure 1.

Figure 1: Kollisionsstruktur im Dag zur Studiumseignung, mit s für Studium, f für fleiss und iq für Intelligenz

Bei positiver Eignung wird ein Studium aufgenommen (studium = 1) ansonsten nicht (studium = 0).

Quelle

Eignung (fürs Studium) sei definiert als die Summe von iq und fleiss, plus etwas Glück, s. Listing 1.

Listing 1: Eignung ist die Summe von Fleiss und Intelligenz, plus ein Quentchen Glück
set.seed(42)  # Reproduzierbarkeit
N <- 1e03  

d_eignung <-
tibble(
  iq = rnorm(N),  # normalverteilt mit MW=0, sd=1
  fleiss = rnorm(N),
  glueck = rnorm(N, mean = 0, sd = .1),
  eignung = 1/2 * iq + 1/2 * fleiss + glueck,
  # nur wer geeignet ist, studiert (in unserem Modell):
  studium = ifelse(eignung > 0, 1, 0) 
  )

Laut unserem Modell setzt sich Eignung zur Hälfte aus Intelligenz und zur Hälfte aus Fleiss zusammen, plus etwas Glück.

Aufgabe: Zeigen Sie, dass eine Scheinkorrelation entsteht zwischen fleiss und iq, wenn man studium kontrolliert. Zeigen Sie außerdem, dass die Scheinkorrelation verschwindet, wenn man studium nicht kontrolliert.

Hinweise:











Lösung

Setup

library(rstanarm)
library(easystats)

Modell Nur-Studis

Hier ist das Modell, in dem wir nur Studenten betrachten, also studium == 1.

m_eignung <-
  stan_glm(iq ~ fleiss, 
           data = d_eignung %>%  filter(studium == 1), 
           refresh = 0)

hdi(m_eignung)
Highest Density Interval

Parameter   |        95% HDI
----------------------------
(Intercept) | [ 0.70,  0.86]
fleiss      | [-0.53, -0.36]
plot(estimate_relation(m_eignung))

Wie man sieht, gibt es einen Zusammenhang zwischen Fleiss und Intelligenz.

Modell Alle-Menschen

m_eignung_gesamtpop <-
  stan_glm(iq ~ fleiss, 
           data = d_eignung , 
           refresh = 0)

plot(estimate_relation(m_eignung_gesamtpop))

hdi(m_eignung_gesamtpop)
Highest Density Interval

Parameter   |       95% HDI
---------------------------
(Intercept) | [-0.09, 0.03]
fleiss      | [-0.05, 0.07]

Wie man sieht, löst sich der Zusammenhang zwischen Fleiss und Intelligenz auf, wenn man studium nicht kontrolliert.