tidy1

tidy
datawrangling
schoice
Published

February 2, 2023

Aufgabe

Das Konzept von “tidy” Daten (“Tidyformat”) spielt in der Datenanalyse eine wichtige Rolle.

Betrachten Sie die Tabellen im Folgenden. Welche ist “tidy”?

Hinweise:

  • Alle Variablen sollen nicht konstant sein, also mehr als einen uniquen Wert aufweisen.
  • Alle Variablen sollen keine fehlenden Werte aufweisen, also komplett sein.
  • Alle Variablen sollen numerisch sein.

Tabelle A:

Tabelle A
group y id1 id2
1 10 1 2
2 20 2 2
1 30 3 2
2 40 4 2

Tabelle B:

Tabelle B
group y id1 id2
1 10 1 A
2 20 2 B
1 30 3 C
2 40 4 D

Tabelle C:

Tabelle C
group y id1 id2
1 10 1 id2
2 20 2 id2
1 30 3 1,2
2 40 4 id2

Tabelle D:

Tabelle D
group y id1 id2
1 10 1 1
2 20 2 1
1 30 3 2
2 40 4 2

Tabelle E:

Tabelle E
group y id1 id2
1 NA 10 1 1
2 NA 20 2 1
1 NA 30 3 2
2 NA 40 4 2

Answerlist

  • Tabelle A
  • Tabelle B
  • Tabelle C
  • Tabelle D
  • Tabelle E











Lösung

Answerlist

  • Falsch. Eine Spalte soll nicht aus einem uniquen Wert bestehen.
  • Falsch. Alle Werte sollen numerisch sein
  • Falsch. Die Spalte id2weißt einen nicht erlaubten Wert auf.
  • Richtig. Das ist ein ‘tidy Tibble’.
  • Falsch. In einem Tidy-Tibble darf keine leere Spalte vorkommen.

Categories:

  • tidy
  • datawrangling
  • schoice