Published March 7, 2022 | Version v1
Conference paper Open

Flexibles Arbeiten mit OCR4all - Massenvolltextdigitalisierung von Drucken mithilfe von OCR-D und hochqualitative Transkription von Handschriften

  • 1. Julius-Maximilians-Universität Würzburg, Germany
  • 2. Staatsbibliothek zu Berlin – Preußischer Kulturbesitz
  • 3. Herzog August Bibliothek Wolfenbüttel
  • 1. Universität der Bundeswehr München, Deutschland
  • 2. Universität Potsdam, Deutschland
  • 3. Digital Humanities im deutschsprachigen Raum e.V., Deutschland

Description

"Die automatisierte Texterkennung von historischen Drucken und Handschriften stellt eine anspruchsvolle Aufgabe bei der Entwicklung modularer wie flexibler OCR-/HTR-Workflows dar. Besonders Forschungsfelder wie Text Mining oder Sentiment Analysis haben die Schwierigkeiten einer Textdigitalisierung entsprechender Materialien bei gleichzeitigem Bedarf großer Textmengen zur Anwendung quantitativer Analyseverfahren erkannt. Auch im Kontext hochqualitativer Volltexterfassungen digitaler Editionen besteht großer Bedarf an intuitiv und komfortabel zu bedienender Software. Die an der Universität Würzburg entwickelte Software OCR4all nimmt neben den formulierten Anforderungen entsprechender Workflowsysteme die Ausrichtung auf einen geisteswissenschaftlichen Nutzer:innenkreis für sich in Anspruch. Durch die baldige Unterstützung der im Rahmen von OCR-D entwickelten Lösungen wird nun die Anwendung im Spannungsfeld einer Massenvolltextdigitalisierung und einer hochqualitativen Erfassung historischer Texte möglich. Der Workshop bietet einen umfassenden Einstieg ins Thema der OCR und HTR historischer Materialien. Teilnehmende werden in die Nutzung von OCR4all eingeführt und dazu befähigt, auf Grundlage anspruchsvoller Ausgangsmaterialien hochqualitative Textdaten zu generieren."

Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.

Files

LANGHANKI_Florian_Flexibles_Arbeiten_mit_OCR4all___Massenvol.pdf

Additional details

Related works

Is part of
Book: 10.5281/zenodo.6304590 (DOI)