Zusammenfassung
Die Verbreitung des Internets, die zunehmende Digitalisierung in der öffentlichen Verwaltung und Politik, sowie die Entfaltung der Civic Technology Bewegung haben über die letzten Jahre zu einer starken Zunahme an hochdetaillierten digitalen Datenbeständen über politische Akteure und Prozesse geführt. Diese big public data werden oft über programmatische Schnittstellen (Web application programming interfaces; programmable Web) verbreitet, um die Einbettung der Daten in anderen Webanwendungen zu vereinfachen und somit ein möglichst großes Publikum zu erreichen. Die Analyse dieser Daten für wissenschaftliche Zwecke in der politischen Ökonomie und Politologie ist vielversprechend, setzt jedoch die Implementierung einer data pipeline zur systematischen Beschaffung und Aufbereitung von Daten aus dem programmable Web voraus. Dieser Artikel diskutiert die Chancen und Herausforderungen der praktischen Nutzung dieser Datenbestände für die empirische Forschung und zeigt anhand einer Fallstudie ein mögliches Vorgehen zur systematischen Analyse von big public data aus dem programmable Web auf.
Abstract
The diffusion of the Internet, the increasing digitization in public service and politics, as well as the evolvement of the civic technology movement have led to a sharp increase in highly granular digital data on political officials und political processes. These big public data are typically distributed in various data formats via so-called Web application programming interfaces in order to facilitate the embedding of these data in web applications with the aim of reaching a large audience. The analysis of these data for research in political economics and political science is very promising. Yet, conducting such analyses efficiently, presupposes the implementation of a data pipeline to systematically collect und combine data from programmable Web sources. This article discusses the opportunities and challenges for the practical exploitation of these new data sources for social-science research. A case study in the context of research on religion in US Politics illustrates an approach to systematically collect and analyse big public data based on the programmable Web.
Notes
Die Begriffe programmable Web und semantic Web werden hier synonym und im Sinne von Swartz (2013) verwendet.
Siehe beispielsweise den Bericht der Stiftung Datenschutz zur praktischen Umsetzung des Rechts auf Datenübertragbarkeit (https://stiftungdatenschutz.org/fileadmin/Redaktion/Datenportabilitaet/studie-datenportabilitaet.pdf): Im Rahmen der Digitalisierungsbemühungen im Gesundheitswesen, wird unter anderem mittels APIs versucht, die Portabilität von Behandlungsdaten zu erhöhen. Der Zugang zu solchen APIs ist entsprechend den geltenden Regeln zu Patientendaten stark eingeschränkt.
Unter Civic Technology (Civic Tech) werden generell Technologien verstanden, welche die politische Partizipation fördern/vereinfachen und den Austausch respektive die Beziehung zwischen Bevölkerung und Regierung stärken. Mit der Civic Technology Bewegung sind Bürger, Journalisten und Aktivisten gemeint, die diese Technologien in konkreten Anwendungen der breiten Bevölkerung zur Verfügung stellen. Beispiele dafür sind die Sunlight Foundation (sunlightfoundation.com) sowie Code for America (codeforamerica.org).
Die Verwendung von APIs respektive API-basierten Anwendungen ist zentraler Bestandteil der Civic Technology Bewegung. Siehe bspw. McNutt et al. (2016) für eine Übersicht über verschiedene Anwendungsbereiche von Web 2.0 Technologien im Civic Tech Bereich.
Siehe Abschn. 5 für mehr Informationen zu dieser API.
Siehe bspw. Matter und Stutzer (2015b).
Siehe die Literaturübersicht in Oldmixon (2009).
Ähnliche Plattformen gibt es seither auch im deutschsprachigen Raum. Bspw. der Wahl-O-Mat in Deutschland (http://www.bpb.de/politik/wahlen/wahl-o-mat/) oder smartvote in der Schweiz (smartvote.ch).
Konkret wird an dieser Stelle ein String-Matching-Verfahren basierend auf der Levenshtein-Distanz eingesetzt. Die Levenshtein-Distanz wird berechnet als die minimale Anzahl nötiger Änderungen (Löschen, Einfügen, Ersetzen) der jeweiligen Zeichenkette aus der Denominationsliste um mit der Zeichenkette der selbstdeklarierten Religionszugehörigkeit eines Politikers übereinzustimmen. Die Denominations-Zeichenkette mit der kleinsten Levenshtein-Distanz zur Zeichenkette der selbstdeklarierten Religionszugehörigkeit eines Politikers gilt dann jeweils als übereinstimmend mit dieser Religionszugehörigkeit.
Zum Bible Belt werden üblicherweise die Südstaaten gezählt. Insbesondere Alabama (AL), Mississippi (MS), Tennessee (TN), Missouri (MO), Kentucky (KY), West Virginia (WV) und Virginia (VA).
Literatur
Besley T (2005) Political Selection. J Econ Perspect 19(3):43–60
Bodle R (2010) Regimes of sharing. Inf Commun Soc 14(3):320–337
Duke JT, Johnson BL (1992) Religious affiliation und congressional representation. J Sci Study Relig 31(3):324–329
Fastnow C, Tobin GJ, Rudolph TJ (1999) Holy roll calls: religious tradition and voting behavior in the U.S. House. Soc Sci Q 80(4):687–701
Feigelson ED, Babu GJ (2012) Big data in astronomy. Significance 9:22–25
Green JC, Guth JL (1991) Religion, representatives, and roll calls. Legis Stud Q 16(4):571–584
Ismail A, Truong H‑L, Kastner W (2019) Manufacturing process data analysis pipelines: a requirements analysis and survey. J Big Data 6(1):1
Luo J, Wu M, Gopukumar D, Zhao Y (2016) Big data application in biomedical research and health care: a literature review. Biomed Inform Insights 8:1
Matter U (2018) RWebData: a high-level interface to the programmable web. J Open Res Softw 6(1):1–12
Matter U, Stutzer A (2015a) pvsR: an open source interface to big data on the American political sphere. PLoS ONE 10(7):e130501
Matter U, Stutzer A (2015b) The role of lawyer-legislators in shaping the law: evidence from voting on tort reforms. J Law Econ 58(2):357–384
McNutt JG, Justice JB, Melitski JM, Ahn MJ, Siddiqui SR, Carter DT, Kline AD (2016) The diffusion of civic technology and open government in the united states. Inf Polity 21(2):153–170
Oldmixon, EA (2009). Religion and legislative politics. In: Guth JL, Kellstadt LA, Smidt CE (Hrsg), The Oxford handbook of religion and American politics. Oxford University Press, Oxford
Richardson JT, Fox SW (1972) Religious affiliation as a predictor of voting behavior in abortion reform legislation. J Sci Study Relig 11(4):347–359
Richardson L, Amundsen M (2013) RESTful Web APIs. O’Reilly, Sebastopol
Sebei H, Taieb H, Ali M, Aouicha BM (2018) Review of social media analytics process and big data pipeline. Soc Netw Anal Min 8(1):28
Smidt CE, Kellstedt LA, Guth JL (2009) The role of religion in American politics: explanatory theories and associated analytical and measurement issues. In: Guth JL, Kellstadt LA, Smidt CE (Hrsg) The Oxford handbook of religion and American politics. Oxford University Press, Oxford
Swartz A (2013) Aaron Swartz’s A programmable web: an unfinished work. In: Hendler J, Ding Y (Hrsg) Synthesis lectures on the semantic web: theory and technology. Morgan & Claypool Publishers, San Rafael
Wald KD, Wilcox C (2006) Getting religion: has political science rediscovered the faith factor? Am Polit Sci Rev 100(4):523–529
Wolf C, Luvaul LC, Onken CA, Smillie JG, White MC (2018) Developing data processing pipelines for massive sky surveys—lessons learned from skymapper. Astron Soc Pac Conf Ser 512:289
Yamane D, Oldmixon EA (2006) Religion in the legislative arena: affiliation, salience, advocacy, und public policymaking. Legis Stud Q 31(3):433–460
Author information
Authors and Affiliations
Rights and permissions
About this article
Cite this article
Matter, U. Big Public Data aus dem Programmable Web: Chancen und Herausforderungen. HMD 56, 1068–1081 (2019). https://doi.org/10.1365/s40702-019-00525-6
Received:
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1365/s40702-019-00525-6