«Big Public Data» als Chance
Ulrich Matter
Ist «Big Public Data» eine Chance oder eine Gefahr für die Gesellschaft? Was kann die Forschung mit den vom Staat erfassten Daten machen? Wann beginnt die informationelle Selbstbestimmung des Einzelnen zu leiden? Zwei Meinungen zum Umgang mit Daten der öffentlichen Verwaltung.
Die Digitalisierung vieler Lebensbereiche, angetrieben durch die Verbreitung von Internet und Mobiltelefonie, führte in den letzten Jahren zu einer wahrhaften Datenflut über diverse Aspekte unseres gesellschaftlichen Zusammenlebens. Dies eröffnet neue Möglichkeiten, ökonomische und gesellschaftliche Zusammenhänge in einem Ausmass empirisch zu erforschen, das vor wenigen Jahren noch undenkbar gewesen wäre.
Neben neuen technischen und methodischen Herausforderungen muss sich sozialwissenschaftliche Forschung mit «Big Data» in manchen Bereichen auch mit wichtigen ethischen Fragen bezüglich der Privatsphäre der Forschungssubjekte auseinander setzen. Es gibt jedoch auch Bereiche von Big Data, welche diesbezüglich kaum problematisch sind: Daten über die öffentliche Verwaltung und die Politik.
Solche «Big Public Data» sind explizit für die Öffentlichkeit bestimmt, haben aber in der sozial wissenschaftlichen Forschung bisher nur wenig Aufmerksamkeit erhalten. Für die zunehmende Verfügbarkeit von Big Public Data ist insbesondere eine Entwicklung relevant: Das Aufkommen von NGOs und Bürgerorganisationen, welche die neuen Möglichkeiten des Internets nutzen, um den politischen Prozess transparenter zu machen.
Insbesondere in den USA ist diese «Open Government»-Bewegung über die letzten fünf Jahre stark gewachsen. Organisationen wie Project Vote Smart oder die Sunlight Foundation veröffentlichen detaillierte Informationen über diverse Aspekte der US-Politik. Dabei nutzen sie neue Webtechnologie-Standards, welche die Vernetzung und den Datentransfer zwischen verschiedenen Applikationen und Benutzern vereinfachen. Dies ermöglicht eine dezentrale Generierung, Aufbereitung und Verbreitung der Daten.
Ein gutes Beispiel liefert die Webseite Project Vote Smart. Die Seite informiert US-Bürger über alle Personen in einem öffentlichen Amt (oder Kandidaten für ein solches Amt) in den USA; vom US- Präsidenten bis zum County-Sheriff. Die Webseite dient den Kandidaten und Politikern auch als Plattform, sich in der Öffentlichkeit zu präsentieren. Dadurch haben diese Anreize, selbst zur umfangreichen Datenbank beizutragen.
Um ihre Mission möglichst effektiv zu erfüllen, stellen Organisationen wie Project Vote Smart ihre Daten aber auch über Schnittstellen anderen Web-Entwicklern zur Verfügung, welche die Daten auf diese Weise einfach in andere Applikationen und Webseiten einbetten können.
Die gleiche Technologie ermöglicht es Forschern, die Daten mittels eigens programmierter Software systematisch zu sammeln und zu analysieren. Ein bedeutender Vorteil dieser Form der Datenerfassung für die empirische Forschung in der politischen Ökonomie ist, dass die Daten unabhängig von einer bestimmten Forschungsfrage generiert und verbreitet werden. Dies ist für viele politökonomische Fragestellungen von zentraler Bedeutung, da oft Eigenschaften oder Verhaltensaspekte von Politikern untersucht werden, welche diese tendenziell verbergen wollen.
Anwendungsgebiete solcher neuen Datenbestände in der politischen Ökonomie sind beispielsweise die Erforschung des Einflusses von Interessegruppen auf die Wirtschaftspolitik basierend auf detaillierten Mikrodaten über Politfinanzierung, sowie die Entwicklung neuer Methoden zur Aufdeckung versteckter Kollaboration in legislativen Versammlungen. Insgesamt versprechen Big Public Data in Verbindung mit neuen rechengestützten Analyseverfahren eine spannende Zeit für die empirische Forschung an der Schnittstelle zwischen Wirtschaft und Politik.
Ulrich Matter hat im Juni 2015 an der Universität Basel seine Dissertation zum Thema «Political Economics in the Age of Big Public Data» an der Wirtschaftswissenschaftlichen Fakultät der Universität Basel vorgelegt. Zurzeit forscht er am Projekt «Uncovering Vote Trading Through Networks and Computation».