Skip to content
/ ml Public

Machine Learning / Multivariate Statistik in Python

Notifications You must be signed in to change notification settings

enatgvhh/ml

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Machine Learning / Multivariate Statistik in Python

Inhalt

Einleitung

Anhand der Stadtteilprofile von Hamburg sollen hier experimentell die Möglichkeiten untersucht werden, die sich mit Machine Learning Packages in Python ergeben. Es geht hier weniger um das Ergebnis als um die methodische Vorgehensweise. Wir werden uns zunächst mit Unsupervised Learning und darauf aufbauend mit Supervised Learning beschäftigen. Die Daten stehen über das Transparenzportal Hamburg frei zur Verfügung. Etwas aufbereitet und als CSV-File gespeichert, können wir nun starten.

Summary

Wir haben uns in den vorhergehenden Kapiteln etwas mit Unsupervised Learning und Supervised Learning beschäftigt. Und es wurde deutlich, dass hier vor allem der Mensch erstmal lernen muss. Lernen welche Methoden, welche Parameter zu wählen sind, wie Entscheidungen zu treffen sind und wie die Ergebnisse sinnvoll interpretiert werden. Die Ergebnisse müssen grundsätzlich kritisch hinterfragt werden. Ganz nach dem Motto "Traue nur der Statistik, die du selbst gefälscht hast". Von daher ist der Begriff multivariate Analysemethoden/Statistik möglicherweise passender.