BigData selbst analysiert
«BigData, das ist das, was die bei Facebook oder Google machen.» So oder so ähnlich dachte ich bisher über die Relevanz des Phänomens für die Medienpädagogik: theoretisch, aber nicht für (niedrigschwellige) praktische Projekte relevant. Weit gefehlt!
Denn nun durfte ich in einem Workshop das Tool BigQuery kennenlernen, das Googles Infrastruktur und Algorithmen für die Analyse großer Datenmengen verfügbar macht. Eigentlich ist das Angebot kostenpflichtig, kann aber 60 Tage lang kostenlos getestet werden.
Und damit kann – wie so oft in der praktischen Medienpädagogik – gearbeitet werden «wie bei den Profis»: Große Datenmengen, etwa aus öffentlichen OpenData-Quellen oder auch die Beispieldaten von Google, können mit MySQL-ähnlichen Befehlen in Nullkommanix durchsucht und Zusammenhänge analysiert werden. Das Ganze sehr niedrigschwellig: Über die Weboberfläche können Daten ausgewählt oder importiert werden. Die Analysebefehle könnten einfacher sein, sind aber recht schnell zu vermitteln bzw. zu erlernen. Und so ist das Angebot nicht weit entfernt von entsprechenden Analysen in Tabellen(kalkulationen).
So entsteht ganz praxisnah ein Gefühl dafür, wie BigData wirklich funktioniert und auch welcher Aufwand dafür erforderlich ist: So habe ich 150 Millionen Datensätze aus der US-Geburtenstatistik durchsucht – und für ein Rechenergebnis nach 11 Sekunden sind im Hintergrund 1000 Rechner erforderlich! Am Ende können aber auch inhaltlich konkrete Erkenntnisse stehen. So habe ich gelernt, dass – zumindest in den USA – im August die meisten Geburten zu verzeichnen sind. 🙂
Für die Medienpädagogik ist BigQuery (und ähnliche Tools, die es auch von anderen Anbieter_innen gibt) damit ein Tool, das auf der Medienebene BigData anschaulich, nachvollziehbar und nutzbar macht – und damit auf der inhaltlichen Ebene über die genutzten Daten die Auseinandersetzung mit Politik, Gesellschaft, Wirtschaft ermöglicht.