#install.packages("palmerpenguins")
library(palmerpenguins)
data("penguins")
<- penguins d
penguins-vis-bodymass1
vis
Aufgabe
Im Datensatz palmerpenguins
: Welche der folgenden Variablen korreliert am stärksten mit dem Körpergewicht der Pinguine?
Beantworten Sie diese Frage mit Hilfe einer Visualisierung!
Sie können den Datensatz so beziehen:
Oder so:
<- read.csv("https://vincentarelbundock.github.io/Rdatasets/csv/palmerpenguins/penguins.csv") d
Ein Codebook finden Sie hier.
Hinweise:
- Orientieren Sie sich im Übrigen an den allgemeinen Hinweisen des Datenwerks.
Lösung
library(tidyverse)
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr 1.1.4 ✔ readr 2.1.5
✔ forcats 1.0.0 ✔ stringr 1.5.1
✔ ggplot2 3.5.0 ✔ tibble 3.2.1
✔ lubridate 1.9.3 ✔ tidyr 1.3.1
✔ purrr 1.0.2
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag() masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(DataExplorer)
<- read.csv("https://vincentarelbundock.github.io/Rdatasets/csv/palmerpenguins/penguins.csv") d
|>
d select(bill_depth_mm, bill_length_mm, flipper_length_mm, body_mass_g) |>
plot_scatterplot(by = "body_mass_g")
Warning: Removed 6 rows containing missing values or values outside the scale range
(`geom_point()`).
Es sieht so aus, also ob flipper_length_mm
am stärksten mit dem Körpergewicht zusammenhängt.