Some first code to process and analyse the Mängelmelder data.
Installation method can vary depending on your OS and what you prefer. IDEs can automate the process. Following instructions work for linux:
- Clone or fork this repo
git clone [email protected]:Open-Data-Hackathon-Konstanz/maengelanalyse_python.git
- Create virtual environment
python -m venv env
- Install requirements inside of virtual environment (use requirements.txt).
source env/bin/activate
- ID = Kennung der Meldung
- Text = Vom Melder eingefügte Beschreibung des Problems
- Kategorie = Zuordnung des Mangels zu einer der Mängelmelder-Kategorien
- Automatisch ermittelte Adresse = Ort der Meldung
- Gruppe = Zugewiesene Zuständigkeit / Aufgabenbereich
- lon = Koordinatenangabe: Längengrad
- lat = Koordinatenangabe: Breitengrad
- Jahr
- Monat
- Gemeldet am = Datum des Meldungseingangs
- Freigegeben am = Datum der Bearbeitungsfreigabe
- Geprüft am = Datum der Prüfung des Problems vor Ort
- Freigabe in = Anzahl der Tage, die zwischen Meldung und Freigabe vergangen sind
- Stadtteil = Stadtteil, in welchem der Mangel zu finden ist
- Verteilung auf Stadtteile
- Zeit: Wann viele Meldungen? Wann viele Meldungen bestimmter Kategorien? Korrelation mit Events?
- In welchem Stadtteil gibt es die meisten Meldungen?
- Welche Abteilung/Amt löst die meisten Mängel?
- Verteilung auf Kategorien
- Wie lange brauchen Meldungen durchschnittlich, bis sie fertig bearbeitet werden?
- Statusupdates nicht in Daten verfügbar, also Zeit bis Prüfung?
- Cluster von Mängeln
- Korrelation Geschwindigkeit der Abarbeitung/Häufigkeit von Meldungen und Wahlen
- Korrelation Anzahl Meldungen mit Zuzug/Wegzug Stadtteil
- Mängel vorhersagen? z.B. bestimmte Menge an Regen -> Gulli verstopft /jemand beschwert sich über Pfütze?