Zusammenfassung
Im vergangenen Jahrzehnt ist das Interesse an der wissenschaftlichen Nachnutzung des Materials aus früheren qualitativen sozialwissenschaftlichen Studien gestiegen. Im Kontrast dazu steht das bisher bescheidene Volumen an für sekundäranalytische Forschung archivierten und genutzten Datensätzen. Dieses Papier gibt einen Überblick über die dahinterstehenden Daten- und Archivierungsprobleme und die Möglichkeiten, über eine Kombination aus manuellen und IT-Werkzeugen eine wesentliche Hürde des Forschungsprozesses - die Auswahl geeigneten Forschungsmaterials - zu überwinden.
Notes
Im digitalen Archiv des SOFI Göttingen befinden sich derzeit die digitalisierten Daten aus über 100 Forschungsprojekten aus der Zeit zwischen 1968 und heute, darunter allein aus 50 Forschungsprojekten bis 1990.
Solche Studien stützen sich auf eine oder (i. d. R.) mehrere Fallstudien in Betrieben bzw. Unternehmen. Im Rahmen einer arbeitssoziologischen Betriebsfallstudie werden neben Beschäftigteninterviews i. d. R. zusätzlich ExpertInnengespräche geführt, Arbeitsplatzbeobachtungen oder -begehungen durchgeführt und Material zu Betrieb und Branche gesammelt. Dieses Material wie auch Leitfäden, Auswertungsdokumente etc. wurden archiviert. Im Archiv befinden sich derzeit alleine schon mehrere Hundert Betriebsfallstudien mit mehreren Tausend Beschäftigteninterviews.
Wir danken unserem Kollegen Klaus-Peter Wittermann, der uns auf wichtige Aspekte dieses Problems und seiner Lösung aufmerksam gemacht hat.
Das vom BmBF geförderte Projekt „Gute Arbeit nach dem Boom - Pilotprojekt zur Längsschnittanalyse arbeitssoziologischer Betriebsfallstudien mit neuen e-Humanities-Werkzeugen (ReSozIT)“ läuft im Verbund von SoziologInnen (SOFI Göttingen), ZeithistorikerInnen (Uni Trier) und Informatikerinnen (Uni Hannover) und stützt sich auf das digitale Archiv des SOFI.
Aufgrund eines Vorläuferprojekts [7] konnten wir hier auf eine dort entwickelte Systematik und für einzelne SOFI-Studien schon entsprechend erzeugte Daten zurückgreifen.
Solche natural language processing Parser basieren auf statistischen und regelbasierten linguistischen Modellen, die auf große annotierte Textkorpora trainiert werden. Stanford Parser wurde dank seiner hohen Erkennungsrate und dem technischen Support gewählt.
So würde die Suche nach „Schweißer“ und „Pass“ etwas ungenauere Ergebnisse liefern, als die nach „Schweißerpass“.
Dies schliesst eine spätere Hinzufügung weiterer einzelner Dokumente nicht aus.
References
Betancort Cabrera N, Haake E (2014) Das qualiservice metadatenschema. (version 1.1) (Februar 2014). http://nbn-resolving.de/urn:nbn:de:gbv:46-00103643-13. Zugegriffen: 13. Feb. 2015
Blei DM, Ng AY, Jordan MI (2003) Latent dirichlet allocation. J Mach Learn Res 3:993–1022
Finkel JR, Grenager T, Manning C (2005) Incorporating non-local information into information extraction systems by gibbs sampling. ACL. Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics, Ann Arbor, Michigan. Association for Computational Linguistics, Stroudsburg, S 363--370
Hatcher E, Gospodnetic O (2004) Lucene in Action. Manning Publications Co., Greenwich
Medjedovic I, Witzel A (2010) Wiederverwendung qualitativer Daten. Verl.Sozialwissenschaften, Wiesbaden
Milne D, Witten IH (2013) An open-source toolkit for mining wikipedia. Artif Intell 194:222–239
Pflüger J, Pongratz HJ, Trinczek R (2010) Fallstudien in der deutschen Arbeits- und Industriesoziologie. In: Pflüger J, Pongratz HJ, Trinczek R (Hrsg) Industriesoziologische Fallstudien. Edition Sigma, Berlin, S 23–70
Smioski A (2013) Archivierungsstrategien für qualitative daten. Forum Qualitative Sozialforschung. 14(3)
Smioski A, Richter R, Bendl T (2009) Archiving of qualitative and quantitative research data at the faculty of social sciences of the university of vienna. Research Report at Vienna University, Faculty of Social Sciences
Tran NK, Zerr S, Bischoff K, Niederée C, Krestel R (2013) Research and advanced technology for digital libraries. In: Aalberg T, Papatheodorou C, Dobreva M, Tsakonas, G, Farrugia, CJ (Hrsg) Topic cropping: leveraging latent topics for the analysis of small corpora. TPDL. Springer Berlin Heidelberg, S 297--308
Tran NK, Zerr S, Bischoff K, Niederée C, Krestel R (2013) „Gute Arbeit“: topic exploration and analysis challenges for the corpora of German qualitative studies. In: Cultural Heritage (ENRICH) Proceedings of the Exploration, Navigation and Retrieval of Information in Cultural Heritage ENRICH 2013 Workshop at 36th International ACM SIGIR Conference on Research and Development SIGIR 2013, Dublin, Ireland
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Baethge-Kinsky, V., Zerr, S. Die Erschließung von Primärmaterial qualitativer Studien für die Sekundäranalyse als Herausforderung für Sozialwissenschaften und Informatik. Datenbank Spektrum 15, 33–39 (2015). https://doi.org/10.1007/s13222-014-0176-8
Received:
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1007/s13222-014-0176-8