Das `{tidyplots}`-Paket

…make both calculations and graphs. Both sorts of output should be studied; each will contribute to understanding.
F. J. Anscombe (1973)

Datenvisualisierung

Datenvisualisierung stellt auch für Sozialwissenschaftler:innen eine essentielle Methode der Datenanalyse dar. Das menschliche System visueller Perzeption ist derart mächtig (Franconeri, Padilla, Shah, Zacks, & Hullman, 2021), dass es bei geeigneten Aufbereitungen selbst Laien leicht möglich ist, komplexere statistische Entitäten wie Effektstärken für Mittelwerte (Schneider, Schmidt, Bohrer, & Merk, 2025) vergleichweise unverzerrt zu rezipieren. Zudem sind graphische Darstellungen sehr gut für die Aufdeckung von Artefakten in Daten und für die explorative Analyse geeignet (Grolemund, 2025).

Unterschiede zwischen `{tidyplots}` und `{ggplot2}`

Im Folgenden wird in Visualisierungen mit den Paketen {tidyplots} und {ggplot2} eingeführt. Vergleichende Vor- und Nachteile sind in Tabelle 1 gegeben. Am Ende dieses Abschnitts ist zudem ein Cheatsheet für einen Überblick verlinkt.

Tabelle 1: Vergleich der besprochenen Pakete

Kategorie	Vorteile	Nachteile
	Sehr einfache Syntax, wenig Code nötig	Weniger flexibel, begrenzte Anpassungsmöglichkeiten
	Automatische gute Designs	Nicht ideal für komplexe oder Publikationsplots
	Perfekt für schnelle Explorationsplots	Kaum Unterstützung für Interaktivität
	Extrem flexibel und anpassbar	Steilere Lernkurve, mehr Code nötig
	Sehr gut für komplexe Visualisierungen	Standarddesign oft zu schlicht
	Interaktivität leicht hinzufügbar	Erfordert manuelle Stilisierung für ansprechende Plots

`{tidyplots}`

Die grundlegende Konstruktion erfolgt in {tidyplots} in den folgenden Schritten:

Festlegung des Datensatzes
Zuweisung von Variablen des Datensatzes zu
- x-Achse
- y-Achse
- Farbe
Hinzufügen von grafischen Elementen (Punkte, Balken, …)
Aufteilung in Unterplots

Beispiel 1: `bill_length_mm` per Species

Beispielstudie

Angenommen ein Forscher:innenteam möchte explorieren wie groß die Effekte der Mittelwertunterschiede in bill_length_mm sind und ob diese statistisch signifikant sind. Was wäre ein geeigneter Plot?

1penguins %>%
2  tidyplot(x = species,
3           y = bill_length_mm,
4           color = species) %>%
5  add_data_points_beeswarm() %>%
6  add_sd_errorbar(linewidth = .2,
7                  width = .21,
8                  color = "#111") %>%
9  add_ci95_errorbar(linewidth = .8,
10                    width = 0,
11                    color = "#111")

1: Wähle den Datensatz penguins
2: Lege die Variable species auf die x-Achse
3: Lege die Variable bill_length_mm auf die y-Achse
4: Enkodiere die Variable species farblich
5: Stelle jeden Datenpunkt sortiert nach dem beeswarm-Algorithmus dar
6: Trage die Standardabweichung als vertikalen Balken der Breite .2,
7: mit horizontalen Enden der Länge .21
8: und der Farbe schwarz auf.
9: Trage ein 95%-Konfidenzinterval als vertikalen Balken der Breite .8,
10: mit horizontalen Enden der Länge 0
11: und der Farbe schwarz auf.

Übung 1: Korrelation `bill_depth_mm` und `bill_length_mm`

Plotten Sie die penguins-Daten so dass Sie die Korrelation bill_depth_mm und bill_length_mm innerhalb der Spezies und speziesübergreifend explorieren können.

Eine Lösung:

# Speziesübergreifend
penguins %>% 
  tidyplot(x = bill_depth_mm,
           y = bill_length_mm) %>% 
  add_data_points() %>%
  add_curve_fit(method = "lm")

# Für jede Spezies
penguins %>% 
  tidyplot(x = bill_depth_mm,
           y = bill_length_mm,
           color = species) %>% 
  add_data_points() %>%
  add_curve_fit(method = "lm")

Übung 2: Verteilungsform der `flipper_length`

Plotten Sie mithilfe des Cheatsheet die Verteilungsform der flipper_length_mm per Spezies in unterschiedlichen Farben als Violinplots und fügen sie das arithmetische Mittel je Species als Punkt hinzu.

Cheatsheet `{tidyplots}`

Literatur

Franconeri, S. L., Padilla, L. M., Shah, P., Zacks, J. M., & Hullman, J. (2021). The Science of Visual Data Communication: What Works. Psychological Science in the Public Interest, 22(3), 110–161.

Grolemund, H. W. and G. (2025). Welcome R for Data Science.

Schneider, J., Schmidt, K., Bohrer, K., & Merk, S. (2025). Communicating Effect Sizes to Teachers: Exploring Different Visualizations and Their Enrichment Options. Zeitschrift für Psychologie, 233(1), 52–63.

Datenvisualisierung

Unterschiede zwischen {tidyplots} und {ggplot2}

{tidyplots}

Beispiel 1: bill_length_mm per Species

Übung 1: Korrelation bill_depth_mm und bill_length_mm

Übung 2: Verteilungsform der flipper_length

Cheatsheet {tidyplots}

Literatur

Unterschiede zwischen `{tidyplots}` und `{ggplot2}`

`{tidyplots}`

Beispiel 1: `bill_length_mm` per Species

Übung 1: Korrelation `bill_depth_mm` und `bill_length_mm`

Übung 2: Verteilungsform der `flipper_length`

Cheatsheet `{tidyplots}`