Skip to main content
Log in

BASE (Bielefeld Academic Search Engine)

Eine Suchmaschinenlösung zur Indexierung wissenschaftlicher Metadaten

  • Schwerpunktbeitrag
  • Published:
Datenbank-Spektrum Aims and scope Submit manuscript

Zusammenfassung

Wissenschaftliche Publikationen und ihre beschreibenden Metadaten stehen in stetig zunehmender Anzahl über Plattformen für elektronische Zeitschriften oder digitale Repositorien frei über das Internet zur Verfügung und lassen sich nachnutzen. Die Metadaten können über OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) abgerufen werden (Harvesting). Durch Weiterverarbeitung und Indexierung der Metadaten lassen sich Services wie die „Bielefeld Academic Search Engine“ (BASE) entwickeln.

Dieser Artikel beschreibt die praktischen Erfahrungen, die seit über 10 Jahren im Rahmen des Betriebs von BASE an der Universitätsbibliothek Bielefeld gewonnen wurden. BASE sammelt Millionen von Metadatensätzen aus Tausenden von Quellen weltweit. Die Metadaten werden während des Indexierungsprozesses teilweise korrigiert, normalisiert und um weitere Informationen angereichert. BASE sammelt zudem Metadaten zu den indexierten Quellen, die ebenfalls für Retrieval und Anzeige verwendet werden.

Eine Übersicht der Services vergleichbarer Suchdienste zeigt auf, welche Unterschiede und Gemeinsamkeiten es zwischen BASE und anderen wissenschaftlichen Suchdiensten gibt.

BASE wird auf vielfältige Weise verwendet, und die enthaltenen Daten werden über Schnittstellen nachgenutzt. Neue Herausforderungen ergeben sich insbesondere aus der Erweiterung des Umfangs der Metadaten und ihrer Bereitstellung mithilfe detaillierterer Datenformate jenseits von Dublin Core. Durch die Anreicherung der Metadaten um Informationen wie Personenattribute (IDs, Affiliationen), Förderorganisationen und verknüpfte Forschungsdaten entsteht die Notwendigkeit, das Datenschema für die Indexierung in geeigneter Weise zu erweitern.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Notes

  1. http://www.sciencedirect.com/scirus/.

  2. http://eurovoc.europa.eu/.

  3. https://en.wikipedia.org/wiki/List_of_academic_databases_and_search_engines.

  4. http://www.oclc.org/oaister.en.html.

  5. http://oaister.worldcat.org/.

  6. https://www.openaire.eu/project-factsheets.

  7. OpenAIRE Guidelines https://guidelines.openaire.eu/.

  8. OpenAIRE’s Content Acquisition Policy https://www.openaire.eu/openaire-s-content-acquisition-policy.

  9. https://www.openaire.eu/search/find?keyword=.

  10. Inclusion Guidelines for Webmasters: https://scholar.google.de/intl/de/scholar/inclusion.html.

  11. http://academic.research.microsoft.com/.

  12. Zum Anonymisieren von Logfiles nach EU-Recht kommt selbst geschriebene Software zum Einsatz, die frei nachgenutzt werden darf: https://github.com/pietsch/loganalyse.

  13. Karlsruher Virtueller Katalog https://kvk.bibliothek.kit.edu/, eine Metasuchmaschine für Bücher und digitale Medien.

  14. MetaGer: https://metager.de.

  15. Searx: https://github.com/asciimoo/searx.

  16. Einen aktuellen Überblick liefert „BASE – a Next Generation Multi-Level Repository-based Service Provider“ https://www.base-search.net/about/download/base_poster.pdf.

  17. https://dini.de/projekte/orcid-de/.

Literatur

  1. Harzing A (2016) Microsoft Academic (Search): a Phoenix arisen from the ashes? Scientometrics. doi:10.1007/s11192-016-2026-y

    Google Scholar 

  2. Jacsó P (2009) Google scholar’s ghost authors. Libr J 134:26–27 (http://lj.libraryjournal.com/2009/11/industry-news/google-scholars-ghost-authors/)

    Google Scholar 

  3. Jacsó P (2010) Metadata mega mess in Google Scholar. Online Inform Rev. doi:10.1108/14684521011024191

    Google Scholar 

  4. Khabsa M, Giles C (2014) The number of scholarly documents on the public web. PLOS ONE 9(5):e93949. doi:10.1371/journal.pone.0093949

    Article  Google Scholar 

  5. Lewandowski D (2002) Alles nur noch Google? Entwicklungen im Bereich der WWW-Suchmaschinen. Bub – Forum Für Bibliothek Inf 54(9):558–561

    Google Scholar 

  6. Lösch M (2011) Automatische Sacherschließung elektronischer Dokumente. Proc. 100. Deutscher Bibliothekartag, Berlin. (http://nbn-resolving.de/urn:nbn:de:0290-opus-10992)

    Google Scholar 

  7. Orduna-Malea E, Ayllón J, Martín-Martín A, López-Cózar E (2015) About the size of Google Scholar: playing the numbers. Scientometrics. doi:10.1007/s11192-015-1614-6

    Google Scholar 

  8. Pieper D, Summann F (2006) Bielefeld Academic Search Engine (BASE). An end-user oriented institutional repository search service. Libr Hi Tech 24:614–619 (http://nbn-resolving.de/urn:nbn:de:0070-pub-27663089)

    Article  Google Scholar 

  9. Pieper D, Summann F (2015) 10 years of „Bielefeld Academic Search Engine“ (BASE): Looking at the past and future of the world wide repository landscape from a service providers perspective. 10th International Conference on Open Repositories (OR2015). (http://nbn-resolving.de/urn:nbn:de:0070-pub-27663089)

    Google Scholar 

  10. Waltinger U, Mehler A, Lösch M, Horstmann W (2011) Hierarchical Classification of OAI Metadata Using the DDC Taxonomy Bd. 6699. Springer, S 29–40 doi:10.1007/978-3-642-23160-5_3

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Amelie Bäcker.

Rights and permissions

Reprints and permissions

About this article

Check for updates. Verify currency and authenticity via CrossMark

Cite this article

Bäcker, A., Pietsch, C., Summann, F. et al. BASE (Bielefeld Academic Search Engine). Datenbank Spektrum 17, 5–13 (2017). https://doi.org/10.1007/s13222-017-0246-9

Download citation

  • Received:

  • Accepted:

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1007/s13222-017-0246-9

Schlüsselwörter

Navigation