movies-vis2

vis
eda
string
Published

February 26, 2023

Aufgabe

Importieren Sie bitte für diese Aufgabe den Datensatz movies (aus dem R-Paket ggplot2movies). Ein Data-Dictionary findet sich hier.

Erstellen Sie folgende Visualisierung:

  • Gruppenvergleich des Budgets pro Jahr
  • Berücksichtigen Sie nur Actionfilme ab 2000
  • Verzichten Sie auf Filme mit einer unterdurchschnittlichen Zahl an Bewertungen (votes; gemessen an allen Filmen, gerundet zur nächsten ganzen Zahl)











Lösung

Pakete starten:

library(tidyverse)
library(DataExplorer)

Daten importieren:

d_path <- "https://vincentarelbundock.github.io/Rdatasets/csv/ggplot2movies/movies.csv"
d <- read.csv(d_path)

Durchschnittliche Zahl an Bewertungen:

d %>% 
  summarise(votes_mean = mean(votes))
  votes_mean
1   632.1304

Die durchschnittliche Zahl an Bewertungen beträgt also 632.

d %>% 
  select(budget, rating, year, votes, Action) %>% 
  filter(year >= 2000) %>% 
  filter(Action == 1) %>% 
  filter(votes >= 632) %>% 
  select(-Action) %>% 
  mutate(year = factor(year)) %>% 
  select(budget, year) %>% 
  plot_boxplot(by = "year")
Warning: Removed 66 rows containing non-finite outside the scale range
(`stat_boxplot()`).

Hinweis: Die Zahl “5.0e+07” ist eine Zahl in der Exponenzial-Schreibweise, nämlich \(5\cdot10^7\), also \(5 \cdot 1000000\).


Categories:

  • vis
  • eda
  • string