Skip to main content
Log in

Big Public Data aus dem Programmable Web: Chancen und Herausforderungen

Big Public Data from the Programmable Web: Opportunities and Challenges

  • Schwerpunkt
  • Published:
HMD Praxis der Wirtschaftsinformatik Aims and scope Submit manuscript

Zusammenfassung

Die Verbreitung des Internets, die zunehmende Digitalisierung in der öffentlichen Verwaltung und Politik, sowie die Entfaltung der Civic Technology Bewegung haben über die letzten Jahre zu einer starken Zunahme an hochdetaillierten digitalen Datenbeständen über politische Akteure und Prozesse geführt. Diese big public data werden oft über programmatische Schnittstellen (Web application programming interfaces; programmable Web) verbreitet, um die Einbettung der Daten in anderen Webanwendungen zu vereinfachen und somit ein möglichst großes Publikum zu erreichen. Die Analyse dieser Daten für wissenschaftliche Zwecke in der politischen Ökonomie und Politologie ist vielversprechend, setzt jedoch die Implementierung einer data pipeline zur systematischen Beschaffung und Aufbereitung von Daten aus dem programmable Web voraus. Dieser Artikel diskutiert die Chancen und Herausforderungen der praktischen Nutzung dieser Datenbestände für die empirische Forschung und zeigt anhand einer Fallstudie ein mögliches Vorgehen zur systematischen Analyse von big public data aus dem programmable Web auf.

Abstract

The diffusion of the Internet, the increasing digitization in public service and politics, as well as the evolvement of the civic technology movement have led to a sharp increase in highly granular digital data on political officials und political processes. These big public data are typically distributed in various data formats via so-called Web application programming interfaces in order to facilitate the embedding of these data in web applications with the aim of reaching a large audience. The analysis of these data for research in political economics and political science is very promising. Yet, conducting such analyses efficiently, presupposes the implementation of a data pipeline to systematically collect und combine data from programmable Web sources. This article discusses the opportunities and challenges for the practical exploitation of these new data sources for social-science research. A case study in the context of research on religion in US Politics illustrates an approach to systematically collect and analyse big public data based on the programmable Web.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Abb. 1
Abb. 2
Abb. 3
Abb. 4
Abb. 5

Notes

  1. Die Begriffe programmable Web und semantic Web werden hier synonym und im Sinne von Swartz (2013) verwendet.

  2. Siehe beispielsweise den Bericht der Stiftung Datenschutz zur praktischen Umsetzung des Rechts auf Datenübertragbarkeit (https://stiftungdatenschutz.org/fileadmin/Redaktion/Datenportabilitaet/studie-datenportabilitaet.pdf): Im Rahmen der Digitalisierungsbemühungen im Gesundheitswesen, wird unter anderem mittels APIs versucht, die Portabilität von Behandlungsdaten zu erhöhen. Der Zugang zu solchen APIs ist entsprechend den geltenden Regeln zu Patientendaten stark eingeschränkt.

  3. Unter Civic Technology (Civic Tech) werden generell Technologien verstanden, welche die politische Partizipation fördern/vereinfachen und den Austausch respektive die Beziehung zwischen Bevölkerung und Regierung stärken. Mit der Civic Technology Bewegung sind Bürger, Journalisten und Aktivisten gemeint, die diese Technologien in konkreten Anwendungen der breiten Bevölkerung zur Verfügung stellen. Beispiele dafür sind die Sunlight Foundation (sunlightfoundation.com) sowie Code for America (codeforamerica.org).

  4. Die Verwendung von APIs respektive API-basierten Anwendungen ist zentraler Bestandteil der Civic Technology Bewegung. Siehe bspw. McNutt et al. (2016) für eine Übersicht über verschiedene Anwendungsbereiche von Web 2.0 Technologien im Civic Tech Bereich.

  5. Siehe Abschn. 5 für mehr Informationen zu dieser API.

  6. Siehe bspw. Matter und Stutzer (2015b).

  7. Siehe die Literaturübersicht in Oldmixon (2009).

  8. Ähnliche Plattformen gibt es seither auch im deutschsprachigen Raum. Bspw. der Wahl-O-Mat in Deutschland (http://www.bpb.de/politik/wahlen/wahl-o-mat/) oder smartvote in der Schweiz (smartvote.ch).

  9. Konkret wird an dieser Stelle ein String-Matching-Verfahren basierend auf der Levenshtein-Distanz eingesetzt. Die Levenshtein-Distanz wird berechnet als die minimale Anzahl nötiger Änderungen (Löschen, Einfügen, Ersetzen) der jeweiligen Zeichenkette aus der Denominationsliste um mit der Zeichenkette der selbstdeklarierten Religionszugehörigkeit eines Politikers übereinzustimmen. Die Denominations-Zeichenkette mit der kleinsten Levenshtein-Distanz zur Zeichenkette der selbstdeklarierten Religionszugehörigkeit eines Politikers gilt dann jeweils als übereinstimmend mit dieser Religionszugehörigkeit.

  10. Zum Bible Belt werden üblicherweise die Südstaaten gezählt. Insbesondere Alabama (AL), Mississippi (MS), Tennessee (TN), Missouri (MO), Kentucky (KY), West Virginia (WV) und Virginia (VA).

Literatur

  • Besley T (2005) Political Selection. J Econ Perspect 19(3):43–60

    Article  Google Scholar 

  • Bodle R (2010) Regimes of sharing. Inf Commun Soc 14(3):320–337

    Article  Google Scholar 

  • Duke JT, Johnson BL (1992) Religious affiliation und congressional representation. J Sci Study Relig 31(3):324–329

    Article  Google Scholar 

  • Fastnow C, Tobin GJ, Rudolph TJ (1999) Holy roll calls: religious tradition and voting behavior in the U.S. House. Soc Sci Q 80(4):687–701

    Google Scholar 

  • Feigelson ED, Babu GJ (2012) Big data in astronomy. Significance 9:22–25

    Article  Google Scholar 

  • Green JC, Guth JL (1991) Religion, representatives, and roll calls. Legis Stud Q 16(4):571–584

    Article  Google Scholar 

  • Ismail A, Truong H‑L, Kastner W (2019) Manufacturing process data analysis pipelines: a requirements analysis and survey. J Big Data 6(1):1

    Article  Google Scholar 

  • Luo J, Wu M, Gopukumar D, Zhao Y (2016) Big data application in biomedical research and health care: a literature review. Biomed Inform Insights 8:1

    Google Scholar 

  • Matter U (2018) RWebData: a high-level interface to the programmable web. J Open Res Softw 6(1):1–12

    Google Scholar 

  • Matter U, Stutzer A (2015a) pvsR: an open source interface to big data on the American political sphere. PLoS ONE 10(7):e130501

    Article  Google Scholar 

  • Matter U, Stutzer A (2015b) The role of lawyer-legislators in shaping the law: evidence from voting on tort reforms. J Law Econ 58(2):357–384

    Article  Google Scholar 

  • McNutt JG, Justice JB, Melitski JM, Ahn MJ, Siddiqui SR, Carter DT, Kline AD (2016) The diffusion of civic technology and open government in the united states. Inf Polity 21(2):153–170

    Article  Google Scholar 

  • Oldmixon, EA (2009). Religion and legislative politics. In: Guth JL, Kellstadt LA, Smidt CE (Hrsg), The Oxford handbook of religion and American politics. Oxford University Press, Oxford

    Article  Google Scholar 

  • Richardson JT, Fox SW (1972) Religious affiliation as a predictor of voting behavior in abortion reform legislation. J Sci Study Relig 11(4):347–359

    Article  Google Scholar 

  • Richardson L, Amundsen M (2013) RESTful Web APIs. O’Reilly, Sebastopol

    Google Scholar 

  • Sebei H, Taieb H, Ali M, Aouicha BM (2018) Review of social media analytics process and big data pipeline. Soc Netw Anal Min 8(1):28

    Article  Google Scholar 

  • Smidt CE, Kellstedt LA, Guth JL (2009) The role of religion in American politics: explanatory theories and associated analytical and measurement issues. In: Guth JL, Kellstadt LA, Smidt CE (Hrsg) The Oxford handbook of religion and American politics. Oxford University Press, Oxford

    Google Scholar 

  • Swartz A (2013) Aaron Swartz’s A programmable web: an unfinished work. In: Hendler J, Ding Y (Hrsg) Synthesis lectures on the semantic web: theory and technology. Morgan & Claypool Publishers, San Rafael

    Google Scholar 

  • Wald KD, Wilcox C (2006) Getting religion: has political science rediscovered the faith factor? Am Polit Sci Rev 100(4):523–529

    Article  Google Scholar 

  • Wolf C, Luvaul LC, Onken CA, Smillie JG, White MC (2018) Developing data processing pipelines for massive sky surveys—lessons learned from skymapper. Astron Soc Pac Conf Ser 512:289

    Google Scholar 

  • Yamane D, Oldmixon EA (2006) Religion in the legislative arena: affiliation, salience, advocacy, und public policymaking. Legis Stud Q 31(3):433–460

    Article  Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Rights and permissions

Reprints and permissions

About this article

Check for updates. Verify currency and authenticity via CrossMark

Cite this article

Matter, U. Big Public Data aus dem Programmable Web: Chancen und Herausforderungen. HMD 56, 1068–1081 (2019). https://doi.org/10.1365/s40702-019-00525-6

Download citation

  • Received:

  • Accepted:

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1365/s40702-019-00525-6

Schlüsselwörter

Keywords

Navigation