OpenDataDay – Feinstaub München und Stuttgart

Zum Open Data Day 2017 hat die Stadt München eine Hackathon veranstaltet. um neue Ideen zum Thema Open Government zu generieren. Es ging darum, mit öffentlich verfügbaren Daten aus dem Münchner Raum echte Probleme zu erkennen und idealerweise auch zu lösen. Sinnvolles mit Daten zu machen klang natürlich sehr verlockend, und so habe ich mit meinem Kollegen Stephan teilgenommen.

Die Auswahl an Daten war durchaus recht interessant: Car- und Bikesharing-Daten, Betriebsinformationen von Rolltreppen, Auslastungen öffentlicher Orte, Anerkennungszahlen des BAMF und auch Feinstaubdaten von privaten Sensoren. Die meisten Gruppen entschieden sich schnell für Mobilitätsanalysen rund um Car- und Bikesharing. Unsere Entscheidung fiel allerdings auf das Thema Feinstaub. Nachdem Stuttgart vor kurzem teilweise Fahrverbote für Dieselfahrzeuge bei Feinstaubalarm angekündigt hat, wollten wir untersuchen, wie eigentlich die Zahlen im Vergleich zu München aussehen.

Feinstaubdaten und Wetterdaten zusammen bringen

Also brauchten wir Daten! Die Feinstaubdaten waren recht leicht auf archive.luftdaten.info erhältlich, leider war das Herunterladen etwas umständlich weil jeder Sensor eine Datei pro Tag erzeugt. Deshalb haben wir uns für den Versuch auf eine Woche Daten beschränkt. Die Daten selber waren sehr leicht verständlich, im Bild rechts sieht man einen Auszug. Die erhöhten Werte (rot ) sind leicht zu erkennen. Diese wollten wir noch mit Wetterdaten der jeweiligen Tage anreichern, am liebsten mindestens stundengenau. Beim Deutschen Wetterdienst wurden wir fündig. Die nächste Wetterstation war zwar „nur“ der Flughafen München, aber immerhin stundengenau. Aufgrund der Kürze der Zeit haben wir uns auf die Regendaten konzentriert, es wäre aber sicher interessant auch die anderen Daten wie Temperatur und Wind zu betrachten.

Diese Daten haben wir dann in dashDB geladen und mit SQL zusammengeführt. Außerdem haben wir die Daten um zusätzliche Eigenschaften angereichert, und zum Beispiel Informationen ob es ein Wochentag oder Wochenende hinzugefügt und Tageszeiten extrahiert. Jetzt konnte es endlich mit der eigentlichen Analyse losgehen. Für die Analyse wollten wir Watson Analytics verwenden. Die Daten aus dashDB haben wir daher mittels Data Connect in Watson Analytics übertragen.

Analyse von Feinstaub und Wetter

Zuerst haben wir uns den Zeitverlauf der Feinstaubwerte über die von uns geladene Woche angeschaut. Dabei wird sofort offensichtlich, dass sich die Feinstaubwerte in München und Stuttgart ähnlich verteilen. Wir haben Daten beginnend vom 1.2.2017 verwendet, also von Mittwoch bis Dienstag. Daher zeigt das Tal in der Mitte der Kurven das Wochenende an. Es hat in dem betrachteten Zeitraum nicht viel geregnet (grüne Linie) und daher sind auch keine Auswirkungen auf die Feinstaubwerte sichtbar. Das Diesel-Fahrverbot ist aktuell nur für Stuttgart angedacht, die Werte zeigen jedoch, dass es für München genauso angebracht wäre. Die Feinstaubwerte in München sind teilweise höher als in Stuttgart.

Als zweites haben wir uns dem Unterschied von Werktag (Montag-Freitag) zu Wochenende gewidmet. Dazu haben wir die Feinstaub-Werte nach Tageszeit gemittelt. Es ist deutlich zu sehen, dass am Wochenende wesentlich weniger Feinstaub in der Luft ist. Der Unterschied ist nicht klein, sondern sehr groß. Daher ist als Verursacher der Verkehr sehr wahrscheinlich. Geheizt wird am Wochenende genauso wie in der Woche.

Es ist auch erkennbar, dass die Werte von Nachmittags bis Nachts stark ansteigen. Wir hätten hohe Werte zum Berufsverkehr erwartet. Dies ist so nicht sichtbar. Unter Umständen dauert es einfach, bis der Feinstaub bei den Sensoren ankommt.

Qualität und Signifikanz der Ergebnisse

Wir haben keinerlei Qualitätskontrolle der Sensoren und der Daten für den Feinstaub vorgenommen. Wir wissen nichts über die Güte der Sensoren oder den Aufstellungsort. Die hier gezeigten Analysen zeigen daher nicht, wie es sich mit dem Feinstaub in München oder Stuttgart wirklich verhält. Vielmehr konnte nur gezeigt werden, dass es prinzipiell möglich ist, die Feinstaubdaten zu verarbeiten und mit Wetterdaten zusammen zu bringen.

Feinstaubsensoren selbst installieren

Um die Thematik Feinstaub weiter zu treiben und Informationen auf breiter Basis zu sammeln, sind Projekte wie luftdaten.info sehr wichtig. Daten zu sammeln und aufzubereiten stärkt das Bewusstsein für die Problematik Feinstaub und Luftqualität. Auf der Webseite von Luftdaten ist auch eine Anleitung für den Bau eines eigenen Sensors abgelegt. Wir werden uns wahrscheinlich an diesem Projekt beteiligen und eigene Sensoren bauen und installieren. Für München ist das dringend notwendig, weil es hier erst 4 (!) private Sensoren im Rahmen des luftdaten.info Projektes gibt. Viel zu wenig, um sich ein gutes Bild machen zu können.

Auf einem der nächsten Meetups von Code for München werden wir gemeinsam die Sensoren zusammenbauen. Seid dabei!

 

re:publica Twitter Trends

Ich war dieses Jahr zwar auf der re:publica, konnte mich aber gar nicht so richtig den Vorträgen und dem Socializing widmen, weil ich gearbeitet habe. Ich will auch gar keinen persönlichen Rückblick geben sondern die Twitter Trends, die ich mit dem Tool Watson Analytics sehen kann, hier zeigen. Ausgewertet habe ich die Tweets mit #rp15. Ich bekomme mit dem Tool ein 10% Sample, alle Zahlen sind also x10.

#rp15 per language

Die Anzahl der Tweets war am ersten Tag mit ~35.000 am höchsten. Der zweite Tag war ähnlich, aber am dritten ging es schon deutlich zurück. Das hat man auch gemerkt, es war insgesamt schon leerer. Die meisten Tweets sind in deutsch, danach englisch und auf Platz 3 und 4 sind französisch und finnisch.

#rp15 per top Hashtag

Schaut man die verwendeten Hashtags (Top 20) neben #rp15 an, kann man erkennen, dass die Angabe eines Hashtags für einen Vortrag wichtig ist. So hat der Sketchnotes Vortrag einen kleinen Peak erzeugt und auch unser Vortrag zu NewWaytoWork ist sichtbar. Der Vortrag des Netflix CEO hat einen beachtlichen Ausschlag verursacht. Das Top Thema war aber der Vortrag von Alexander Gerst zur ISS Mission. Da wurde wie wild getwittert (mehr als doppelt so viel wie bei Netflix), aber es gab kein einheitlich verwendetes Hashtag. Daher kommt das in der obigen Grafik nicht raus. Das Land Baden-Württemberg hat es mit Freibier geschafft, permanent mit dem Hashtag #bwjetzt in den Trends aufzutauchen.

#rp15 BahnstreikAuch der Bahnstreik hat sich in den Tweets niedergeschlagen. Allerdings primär vor der re:publica. Als erst mal alle da waren, war das Thema auch nicht mehr wichtig.

#rp15 Author CountryDie geografische Verteilung der Twitterer ist ziemlich global. Natürlich haben diese Info nicht alle hinterlegt, aber trotzdem bekommt man einen guten Einblick, von woher die Teilnehmer kommen. Die meisten natürlich aus Deutschland, Asien ist gut vertreten, Afrika nur punktuell.

Um die Verhältnisse ins rechte Licht zu rücken, als letztes nun ein Vergleich von #rp15 mit #fcbfcb. Über dieses Fußballspiel wurde mehr als 10x mehr getwittert als über die re:publica. Mag vielleicht auch am Ergebnis liegen…

Bildschirmfoto 2015-05-09 um 15.47.53