Herzlich Willkommen zu unserem Workshop zur Datenbereinigung mit R!
- Die Materialien zum Workshop können hier heruntergeladen werden.
- Danach die Datei entzippen und in dem Ordner speichern, wo das R-Projekt abgelegt werden soll.
- Öffnen des R-Projekts über die Datei data-manipulation.Rproj
Tag 1:
- Getting started:
- Daten importieren
- Übersicht über den Datensatz verschaffen
- Die Pipe
- Attributes
- Datenmanipulation aka die
dplyr
-Verben:- filter
- arrange
- select
- mutate
- summarize
- group_by
- Datentypen und Outlier:
- Vektoren und andere Datentypen
- NA's
- Outlier finden
Tag 2:
- Datensätze zusammenfügen:
- Verschiedene Arten an Joins
dplyr
-Joins
- String-Manipulation:
- Umgang mit Umlauten
- Regex
- Hands-On Session