data(mtcars)
<- lm(mpg ~ hp, data = mtcars)
lm1 coef(lm1)
(Intercept) hp
30.09886054 -0.06822828
May 17, 2023
In einer Analyse ist ein Team von Analysten interessiert, den Spritverbrauch von Fahrzeugen (gemessen in Meilen per Gallone mpg
) in einem bestimmten Marksegment zu modellieren auf Basis der PS-Zahl (horse power, hp
).
Das Team analysiert die vorliegenden Daten des Trainings-Datensatzes und stellt folgendes Modell auf:
Das Einflussgewicht des Prädiktors wird auf 0 geschätzt.
Im Testdatensatz wird nun der mittlere Verbrauch mittels Bootstrapping-Methode bestimmt. Es ergibt sich folgendes Diagramm:
Registered S3 method overwritten by 'mosaic':
method from
fortify.SpatialPolygonsDataFrame ggplot2
The 'mosaic' package masks several functions from core packages in order to add
additional features. The original behavior of these functions should not be affected by this.
Attaching package: 'mosaic'
The following objects are masked from 'package:dplyr':
count, do, tally
The following object is masked from 'package:Matrix':
mean
The following object is masked from 'package:ggplot2':
stat
The following objects are masked from 'package:stats':
binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
quantile, sd, t.test, var
The following objects are masked from 'package:base':
max, mean, min, prod, range, sample, sum
Welche Aussage lässt sich aus diesem Diagramm ableiten?
hp
liegt ca. zwischen -0.10 und -0.05.hp
liegt bei ca. -0.07.hp
kann nicht abgeleitet werden.
Categories:
---
extype: schoice
exsolution: 1000
exname: bootstrap
categories:
- statlearning
- inference
- schoice
date: '2023-05-17'
slug: bootstrap
title: bootstrap
---
# Aufgabe
In einer Analyse ist ein Team von Analysten interessiert, den Spritverbrauch von Fahrzeugen (gemessen in Meilen per Gallone `mpg`) in einem bestimmten Marksegment zu modellieren auf Basis der PS-Zahl (*horse power*, `hp`).
Das Team analysiert die vorliegenden Daten des Trainings-Datensatzes und stellt folgendes Modell auf:
```{r}
data(mtcars)
lm1 <- lm(mpg ~ hp, data = mtcars)
coef(lm1)
```
Das Einflussgewicht des Prädiktors wird auf `r round(coef(lm1))[2]` geschätzt.
Im Testdatensatz wird nun der mittlere Verbrauch mittels Bootstrapping-Methode bestimmt. Es ergibt sich folgendes Diagramm:
```{r boot1, echo = FALSE, fig.height = 3.5, fig.width = 5.8, fig.path = "", fig.cap = ""}
library(mosaic)
boot1 <- do(1000) * lm(mpg ~ hp, data = resample(mtcars))
gf_histogram(~hp, data = boot1)
```
Welche Aussage lässt sich aus diesem Diagramm ableiten?
Answerlist
----------
* Das 95%-Konfidenzintervall für den Einfluss von `hp` liegt ca. zwischen -0.10 und -0.05.
* Das 95%-Konfidenzintervall für den Einfluss von `hp` liegt bei ca. -0.07.
* Die resultierende Verteilung ist normalverteilt.
* Eine Entscheidung zur statistischen Signifikanz des Prädiktors `hp` kann nicht abgeleitet werden.
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
# Lösung
---
Categories:
- statlearning
- inference
- schoice