bootstrap

statlearning
inference
schoice
Published

May 17, 2023

Aufgabe

In einer Analyse ist ein Team von Analysten interessiert, den Spritverbrauch von Fahrzeugen (gemessen in Meilen per Gallone mpg) in einem bestimmten Marksegment zu modellieren auf Basis der PS-Zahl (horse power, hp).

Das Team analysiert die vorliegenden Daten des Trainings-Datensatzes und stellt folgendes Modell auf:

data(mtcars)
lm1 <- lm(mpg ~ hp, data = mtcars)
coef(lm1)
(Intercept)          hp 
30.09886054 -0.06822828 

Das Einflussgewicht des Prädiktors wird auf 0 geschätzt.

Im Testdatensatz wird nun der mittlere Verbrauch mittels Bootstrapping-Methode bestimmt. Es ergibt sich folgendes Diagramm:

Registered S3 method overwritten by 'mosaic':
  method                           from   
  fortify.SpatialPolygonsDataFrame ggplot2

The 'mosaic' package masks several functions from core packages in order to add 
additional features.  The original behavior of these functions should not be affected by this.

Attaching package: 'mosaic'
The following objects are masked from 'package:dplyr':

    count, do, tally
The following object is masked from 'package:Matrix':

    mean
The following object is masked from 'package:ggplot2':

    stat
The following objects are masked from 'package:stats':

    binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
    quantile, sd, t.test, var
The following objects are masked from 'package:base':

    max, mean, min, prod, range, sample, sum

Welche Aussage lässt sich aus diesem Diagramm ableiten?

Answerlist

  • Das 95%-Konfidenzintervall für den Einfluss von hp liegt ca. zwischen -0.10 und -0.05.
  • Das 95%-Konfidenzintervall für den Einfluss von hp liegt bei ca. -0.07.
  • Die resultierende Verteilung ist normalverteilt.
  • Eine Entscheidung zur statistischen Signifikanz des Prädiktors hp kann nicht abgeleitet werden.











Lösung


Categories:

  • statlearning
  • inference
  • schoice