Textverarbeitung zur Vorbereitung und Durchführung einer automatischen Indexierung

Knorz, G.; Putze, G.

doi:10.1007/978-3-642-67700-7_10

G. Knorz &
G. Putze

Part of the book series: Informatik-Fachberichte ((INFORMATIK,volume 30))

29 Accesses
1 Citations

Zusammenfassung

Der Beitrag beschreibt die allgemeine Konzeption einer automatischen, wörterbuchabhängigen Indexierung, wie sie in einem Projekt an der Technischen Hochschule Darmstadt verfolgt wird. Lösungen für Probleme, die im Rahmen der automatischen Indexierung unmittelbar die Verarbeitung von Texten betreffen, werden vorgestellt und diskutiert- sowie die dazu im Darmstädter Projekt angewandten Verfahren dargestellt. Aufgabe und Inhalt eines Wörterbuchs für automatische Indexierung werden umrissen. Verfahren, die aus Texten Daten zum Aufbau eines Wörterbuchs generieren, werden eingeordnet und exemplarisch vorgestellt, dabei wird auf typische Schwierigkeiten und Probleme eingegangen.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 54.99; Price excludes VAT (USA)

Softcover Book: USD 69.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Anmerkungen

Die automatischen Systeme mit Freitextsuche über Stichwörter, die sich als Alternative zur manuellen Indexierung anbieten, vermindern nicht den Arbeitsaufwand, sondern verlagern ihn von der Indexierung zur Frageformulierung
Google Scholar
Es handelt sich um ein Projekt im Rahmen des Förderungsprogramms “Information und Dokumentation„ der Bundesregierung
Google Scholar
Als relevant werden all die Textwörter bezeichnet, die nicht in einer Stopwörterliste (Funktionswörter und ‘high -frequency-words’) enthalten sind
Google Scholar
Wesentlich ist, daß die Zuteilung von nicht zutreffenden Deskriptoren vermieden wird. Da man annehmen kann, daß die von Homographen im Text ausgehenden (schwachen) Hinweise auf solche Deskriptoren nicht durch weitere (von anderen Texteigenschaften ausgehende) Hinweise verstärkt werden, wird die Relevanzbeschreibung dieser Deskriptoren nicht zur Zuteilung führen
Google Scholar
Zur Differenzieruncr von Mehrwortgruppen in Fachausdrücke und sonstige Mehrwortgruppen s. Abschn. 3.3.1
Google Scholar
Diese Form ist durch das Verfahren zur Gewinnung von Mehrwortgruppen für das Wörterbuch festgelegt
Google Scholar
Unter Term ist ein Einzelwort oder eine Mehrwortgruppe zu verstehen.
Google Scholar
Die Verwendung eines Terms im Titel ist ebenfalls eine (allerdings von syntaktischen Strukturen unabhängige) Form der Hervorhebung, die im Rahmen des Projekts verwertet wird.
Google Scholar
Dazu gehören wesentlich auch Operationen zur Datensicherung und -Reparatur
Google Scholar
Tabellenorientierte Anfrage- und Auswertungssprache für das Archivsystem
Google Scholar
Bei FST handelt es sich um ein Versuchswörterbuch für das Fachgebiet Food Science and Technology.
Google Scholar
Die genaue Kennzeichnung von Relationen bezüglich Herkunft (Material, Zeitraum) führt vorerst dazu, daß zwischen gleichen Terms oft mehrere gleichartige Relationen bestehen. Teil der Arbeit, an dem Wörterbuch ist es, solche Relationen zusammenzufassen
Google Scholar
Beiträge dazu sind u.a. Ziel einer laufenden Diplomarbeit, in der das Begrenzerverfahren in einen Vergleich syntaktischer Verfahren einbezogen wird.
Google Scholar
Fangmeyer, H.; Lustig, G.: The EURATOM automatic indexing projekt. S. 1310–1314 in: International Federation for Information Processing, IFIP. Congress 68, Edinburgh. North Holland, Amsterdam, 1969
Google Scholar
Jaene, H.; Seelbach, D.: Maschinelle Extraktion von zusammengesetzten Ausdrücken aus englischen Fachtexten. (ZMD-A-29). Beuth Verlag, 1975
Google Scholar
Knorz, G.: Struktur und Aufbau des Archivwörterbuchs für das Projekt “Wörterbuchentwicklung für automatisches Indexing„. Interner Bericht, (DV II 78–1, FB Informatik, TH Darmstadt
Google Scholar
Knorz, G.: TA3, Tabellenorientierte Anfrage- und Auswertungssprache für das Archiv-System im Projekt “Wörterbuchentwicklung für automatisches Indexing„ — Sprachbeschreibung. (DV II 79–2), FB Informatik, TH Darmstadt
Google Scholar
Knorz, G.: Das Konzept des Programmiersprachenkerns von TA3 -Darstellung eines deskriptiv orientierten Ansatzes —. In: Tagungsband für die GI-Fachtagung: “Programmiersprachen und Programmentwicklung„, Darmstadt, März 1980
Google Scholar
Kragenings, R.: Statistische Relationen zwischen Textwörtern und Deskriptoren. (ZMD-A-25), Beuth Verlag, 1974
Google Scholar
Kuhlen, R.: Experimentelle Morphologie in der Informationswissenschaft. Verlag Dokumentation, München, 1977
Google Scholar
Lustig, G.: Methoden der automatischen Indexierung. S. 108–117 in Beiheft Nr. 20 “Sprachliche Ansätze im Informationsund Dokumentationsbereich„ (1970) der Nachrichten für Dokumentation
Google Scholar
Lustig, G.: Probleme der Textverarbeitung bei der automatischen Indexierung. In Schanze, H. (Hrsg.): Literatur und Datenverarbeitung, Niemeyer, Tübingen, 1972
Google Scholar
Lustig, G.: Ansätze einer realistischen automatischen Indexierung unter Verwendung statistischer Verfahren. In: Kuhlen, R. (Hrsg.): Datenbanken — Datenbasen- Netzwerke. Praxis des Information Retrieval Bd. 1, Verlag Dokumentation, München, 1979
Google Scholar
Lustig, G.: Über die Entwicklung eines automatischen Indexie-rungssystems. In: Tagungsband für “Internationales Colloquium zur linguistischen und literarischen Datenverarbeitung„, Bonn, Dezember 1979
Google Scholar
Projekt “Wörterbuchentwicklung für automatisches Indexing„. Sachbericht 1978. (DV II 78–3), FB Informatik, TH Darmstadt
Google Scholar
Projekt “Wörterbuchentwicklung für automatisches Indexing„. Sachbericht 1979. (DV II 79–3), FB Informatik, TH Darmstadt
Google Scholar

Download references

Authors

G. Knorz
View author publications
You can also search for this author in PubMed Google Scholar
G. Putze
View author publications
You can also search for this author in PubMed Google Scholar

Editor information

Editors and Affiliations

Universität Bayreuth, Luitpoldplatz 3, 8580, Bayreuth, Deutschland
Peter Rütger Wossidlo (Lehrstuhl für Betriebswirtchafrslehre I (Finanzwirtschaft ung Organisation) (Lehrstuhl für Betriebswirtchafrslehre I (Finanzwirtschaft ung Organisation)

Rights and permissions

Reprints and permissions

Copyright information

About this paper

Cite this paper

Knorz, G., Putze, G. (1980). Textverarbeitung zur Vorbereitung und Durchführung einer automatischen Indexierung. In: Wossidlo, P.R. (eds) Textverarbeitung und Informatik. Informatik-Fachberichte, vol 30. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-67700-7_10

Download citation

DOI: https://doi.org/10.1007/978-3-642-67700-7_10
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-10148-2
Online ISBN: 978-3-642-67700-7
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics