bootstrap

statlearning

inference

schoice

Published

May 17, 2023

Aufgabe

In einer Analyse ist ein Team von Analysten interessiert, den Spritverbrauch von Fahrzeugen (gemessen in Meilen per Gallone mpg) in einem bestimmten Marksegment zu modellieren auf Basis der PS-Zahl (horse power, hp).

Das Team analysiert die vorliegenden Daten des Trainings-Datensatzes und stellt folgendes Modell auf:

data(mtcars)
lm1 <- lm(mpg ~ hp, data = mtcars)
coef(lm1)

(Intercept)          hp 
30.09886054 -0.06822828

Das Einflussgewicht des Prädiktors wird auf 0 geschätzt.

Im Testdatensatz wird nun der mittlere Verbrauch mittels Bootstrapping-Methode bestimmt. Es ergibt sich folgendes Diagramm:

Registered S3 method overwritten by 'mosaic':
  method                           from   
  fortify.SpatialPolygonsDataFrame ggplot2


The 'mosaic' package masks several functions from core packages in order to add 
additional features.  The original behavior of these functions should not be affected by this.


Attaching package: 'mosaic'

The following objects are masked from 'package:dplyr':

    count, do, tally

The following object is masked from 'package:Matrix':

    mean

The following object is masked from 'package:ggplot2':

    stat

The following objects are masked from 'package:stats':

    binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
    quantile, sd, t.test, var

The following objects are masked from 'package:base':

    max, mean, min, prod, range, sample, sum

Welche Aussage lässt sich aus diesem Diagramm ableiten?

Answerlist

Das 95%-Konfidenzintervall für den Einfluss von hp liegt ca. zwischen -0.10 und -0.05.
Das 95%-Konfidenzintervall für den Einfluss von hp liegt bei ca. -0.07.
Die resultierende Verteilung ist normalverteilt.
Eine Entscheidung zur statistischen Signifikanz des Prädiktors hp kann nicht abgeleitet werden.

Lösung

Categories:

statlearning
inference
schoice