Research work on Arabic optical text recognition (AOTR), although lagging that of other languages, is becoming more intensive than before and commercial systems for AOTR are becoming available. This paper presents a comprehensive survey and bibliography of research on AOTR, by covering all the research publications on AOTR to which the authors had access. This paper introduces the general topic of optical character recognition (OCR), and highlights the characteristics of Arabic text. It also presents an historical review of the Arabic text recognition systems. Further, this paper reports on the state of the art in AOTR research, and lists the specifications of commercially available systems for AOTR. In this paper, we first underline the capabilities of different AOTR systems, and then introduce a five stage model for AOTR systems and classify research work according to this model. We devote a section to each of the stages of this model: preprocessing, segmentation, feature extraction, classification, and post-processing. In the preprocessing section, we emphasize handling degraded documents, and thinning of Arabic text. In the segmentation section, we discuss methods of segmenting Arabic text and categorize the methods into five general approaches. In the feature extraction and classification sections, we highlight the main techniques and analyze AOTR research works based on those techniques. We then discuss approaches for post-processing and show their relation to the Arabic language. We conclude by pointing problems and directions for future research on AOTR.
Forschungsarbeiten über die optische Erkennung arabischer Texte (AOTR) werden mit zunehmender Intensität betrieben, obwohl sie gegenüber anderen Sprachen etwas verzögert sind. Kommerzielle Systeme für AOTR sind schon erhältlich. Diese Arbeit gibt eine umfassende Übersicht und Bibliographie zur Forschung über AOTR, die alle Forschungsveröffentlichungen einschlieβt, zu denen die Autoren Zugang hatten. Diese Arbeit führt in die allgemeine Thematik der optischen Zeichenerkennung (OCR) ein und hebt die Besonderheiten arabischer Texte hervor. Sie gibt auβerdem einen geschichtlichen Überblick über Erkennungssysteme für arabische Texte. Zusätzlich wird über den letzten Stand der AOTR-Forschungen berichtet, und es werden die Spezifikationen kommerziell erhältlicher AOTR-Systeme angeführt. Zuerst unterstreichen wir die Mőglichkeiten der verschiedenen AOTR-Systeme, danach stellen wir ein Fünf-Stufen-Modell für AOTR-Systeme vor und klassifizieren die Forschungsarbeiten anhand dieses Modells. Wir widmen jeder dieser Modellstufen einen Abschnitt: Vorverarbeitung, Segmentierung, Merkmalsextraktion, Klassifikation und Nachverarbeitung. Im Abschnitt über Vorverarbeitung heben wir die Behandlung beschädigter Dokumente hervor und die Ausdünnung arabischer Texte. Danach diskutieren wir Methoden zur Segmentierung arabischer Texte and unterteilen die Methoden in fünf Ansätze. In den Abschnitten über Merkmalsextraktion und Klassifikation heben wir die wichtigsten Techniken hervor und analysieren die AOTR-Arbeiten in bezug auf diese Techniken. Danach diskutieren wir Ansätze für die Nachverarbeitung und zeigen ihre Beziehung zur arabischen Sprache. Wir schlieβen die Arbeit mit Hinweisen auf Probleme und auf zukünftige Forschungsarbeiten in AOTR.
Le travail de recherche sur la Reconnaissance Optique de Textes Arabes (ROTA), bien que moins avancé que pour d'autres langues, devient plus intensif qu'avant, et des systèmes commerciaux de ROTA deviennent disponibles. Cet article présente un apercu et une bibliographie de la recherche sur le ROTA, couvrant toutes les publications sur le sujet auxquelles les auteurs ont eu accès. Cet article introduit le sujet plus géneral de la Reconnaissance Optique de Caractères (ROC), et met l'accent sur les caractéristiques du texte arabe. Il présente également un résumé historique des systèmes de reconnaissance des textes arabes. Plus loin, ce texte fait un “état des lieux” de la recherche sur la ROTA, et énumère les specifications des systèmes disponibles commercialement. Dans cet article, nous soulignons d'abord les capacités des différents systèmes de ROTA, puis introduisons un modèle à 5 niveaux pour ces systèmes, et classons le travail de recherche d'après ce modèle. Nous consacrons une section à chacun des étages de ce modèle: prétraitement, segmentation, extraction de caractéristiques, classification et post-traitement. Dans la section consacrée au pré-traitement, nous accentuons le traitement du texte arabe dégradé, et l'amincissement du même texte. Dans la section de segmentation, nous discutons les méthodes de segmentation des textes arabes et catégorisons les méthodes selon 5 approaches générales. Dans les sections d'extraction de caractéristiques et de classification, nous soulignons les techniques principales et analysons les travaux de ROTA basés sur les dites techniques. Nous discutons ensuite des approaches pour le post-traitement et montrons leurs relations avec la langue arabe. Nous concluerons en indiquant certains problèmes et certaines directions pour la recherche future en ROTA.