Zusammenfassung
Wissenschaftliche Publikationen und ihre beschreibenden Metadaten stehen in stetig zunehmender Anzahl über Plattformen für elektronische Zeitschriften oder digitale Repositorien frei über das Internet zur Verfügung und lassen sich nachnutzen. Die Metadaten können über OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) abgerufen werden (Harvesting). Durch Weiterverarbeitung und Indexierung der Metadaten lassen sich Services wie die „Bielefeld Academic Search Engine“ (BASE) entwickeln.
Dieser Artikel beschreibt die praktischen Erfahrungen, die seit über 10 Jahren im Rahmen des Betriebs von BASE an der Universitätsbibliothek Bielefeld gewonnen wurden. BASE sammelt Millionen von Metadatensätzen aus Tausenden von Quellen weltweit. Die Metadaten werden während des Indexierungsprozesses teilweise korrigiert, normalisiert und um weitere Informationen angereichert. BASE sammelt zudem Metadaten zu den indexierten Quellen, die ebenfalls für Retrieval und Anzeige verwendet werden.
Eine Übersicht der Services vergleichbarer Suchdienste zeigt auf, welche Unterschiede und Gemeinsamkeiten es zwischen BASE und anderen wissenschaftlichen Suchdiensten gibt.
BASE wird auf vielfältige Weise verwendet, und die enthaltenen Daten werden über Schnittstellen nachgenutzt. Neue Herausforderungen ergeben sich insbesondere aus der Erweiterung des Umfangs der Metadaten und ihrer Bereitstellung mithilfe detaillierterer Datenformate jenseits von Dublin Core. Durch die Anreicherung der Metadaten um Informationen wie Personenattribute (IDs, Affiliationen), Förderorganisationen und verknüpfte Forschungsdaten entsteht die Notwendigkeit, das Datenschema für die Indexierung in geeigneter Weise zu erweitern.
Notes
OpenAIRE Guidelines https://guidelines.openaire.eu/.
OpenAIRE’s Content Acquisition Policy https://www.openaire.eu/openaire-s-content-acquisition-policy.
Inclusion Guidelines for Webmasters: https://scholar.google.de/intl/de/scholar/inclusion.html.
Zum Anonymisieren von Logfiles nach EU-Recht kommt selbst geschriebene Software zum Einsatz, die frei nachgenutzt werden darf: https://github.com/pietsch/loganalyse.
Karlsruher Virtueller Katalog https://kvk.bibliothek.kit.edu/, eine Metasuchmaschine für Bücher und digitale Medien.
MetaGer: https://metager.de.
Einen aktuellen Überblick liefert „BASE – a Next Generation Multi-Level Repository-based Service Provider“ https://www.base-search.net/about/download/base_poster.pdf.
Literatur
Harzing A (2016) Microsoft Academic (Search): a Phoenix arisen from the ashes? Scientometrics. doi:10.1007/s11192-016-2026-y
Jacsó P (2009) Google scholar’s ghost authors. Libr J 134:26–27 (http://lj.libraryjournal.com/2009/11/industry-news/google-scholars-ghost-authors/)
Jacsó P (2010) Metadata mega mess in Google Scholar. Online Inform Rev. doi:10.1108/14684521011024191
Khabsa M, Giles C (2014) The number of scholarly documents on the public web. PLOS ONE 9(5):e93949. doi:10.1371/journal.pone.0093949
Lewandowski D (2002) Alles nur noch Google? Entwicklungen im Bereich der WWW-Suchmaschinen. Bub – Forum Für Bibliothek Inf 54(9):558–561
Lösch M (2011) Automatische Sacherschließung elektronischer Dokumente. Proc. 100. Deutscher Bibliothekartag, Berlin. (http://nbn-resolving.de/urn:nbn:de:0290-opus-10992)
Orduna-Malea E, Ayllón J, Martín-Martín A, López-Cózar E (2015) About the size of Google Scholar: playing the numbers. Scientometrics. doi:10.1007/s11192-015-1614-6
Pieper D, Summann F (2006) Bielefeld Academic Search Engine (BASE). An end-user oriented institutional repository search service. Libr Hi Tech 24:614–619 (http://nbn-resolving.de/urn:nbn:de:0070-pub-27663089)
Pieper D, Summann F (2015) 10 years of „Bielefeld Academic Search Engine“ (BASE): Looking at the past and future of the world wide repository landscape from a service providers perspective. 10th International Conference on Open Repositories (OR2015). (http://nbn-resolving.de/urn:nbn:de:0070-pub-27663089)
Waltinger U, Mehler A, Lösch M, Horstmann W (2011) Hierarchical Classification of OAI Metadata Using the DDC Taxonomy Bd. 6699. Springer, S 29–40 doi:10.1007/978-3-642-23160-5_3
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Bäcker, A., Pietsch, C., Summann, F. et al. BASE (Bielefeld Academic Search Engine). Datenbank Spektrum 17, 5–13 (2017). https://doi.org/10.1007/s13222-017-0246-9
Received:
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1007/s13222-017-0246-9