Mehrfache phonetische Darstellung in einem Spracherkennungssystem für großen Wortschatz

Kaltenmeier, Alfred; Stall, David

doi:10.1007/978-3-662-22205-8_26

Mehrfache phonetische Darstellung in einem Spracherkennungssystem für großen Wortschatz

Alfred Kaltenmeier² &
David Stall²

Conference paper

70 Accesses

Part of the book series: Informatik-Fachberichte ((INFORMATIK,volume 149))

Zusammenfassung

Dieser Beitrag beschreibt ein zweistufiges Verfahren zur Generierung und Verifikation von Worthypothesen in Spracherkennungssystemen mit großem Wortschatz. Dieses Verfahren wird implementiert in einem sprachverstehenden System für kontinuierliche Sprache, das im ESPRIT Projekt Nr. 26 entwickelt wird. Das Ziel des Projekts ist die Realisierung eines Demonstrationssystems für ein Vokabular von etwa 1000 Wörtern; die Zielsetzung ist ähnlich wie beim SPICOS-Projekt. Wegen des Umfangs des Wortschatzes muß die Spracherkennung in solchen Systemen auf phonetischen Einheiten beruhen, die kleiner als Wörter sind. Wegen der natürlichen kontinuierlichen Sprechweise müssen für jedes Wort neben der Standardaussprache auch alle üblichen durch Koartikuation und natürliche Verschleifung entstehenden Aussprachevarianten berücksichtigt werden.

Das Wortlexikon enthält für jede der beiden Stufen des Systems eine eigene phonetische Darstellung: eine grobe phonetische Beschreibung (GPB) für die Generierung und eine feine phonetische Beschreibung (FPB) für die Verifikation von Worthypothesen. Beide Beschreibungen einschließlich der Aussprachevarianten werden automatisch nach Regeln aus einer einzigen Stammbeschreibung erzeugt und als Graphen implementiert.

This is a preview of subscription content, log in via an institution.

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 44.99; Price excludes VAT (USA)

Softcover Book: USD 59.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Learn about institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literatur

H. Hoge, H. Ney: Architektur des sprachverstehenden Systems SPICOS URSI, Kleinheubacher Berichte, Okt. 1985
Google Scholar
R. Mühlfeld: Verifikation von Worthypothesen Dissertation, Univ. Erlangen-Nürnberg, Arbeitsberichte des IMMD Band 19, Nr. 4, Erlangen, Juni 1986
Google Scholar
M. Cravero, R. Pieraccini, F. Raineri: Definition of Recognition Units Through Two Levels of Phonemic Description Montreal Symposium on Speech Recognition, Juli 1986, pp. 53–54
Google Scholar

Download references

Author information

Authors and Affiliations

AEG Forschungsinstitut, Ulm, Deutschland
Alfred Kaltenmeier & David Stall

Authors

Alfred Kaltenmeier
View author publications
You can also search for this author in PubMed Google Scholar
David Stall
View author publications
You can also search for this author in PubMed Google Scholar

Editor information

Editors and Affiliations

Institut für Nachrichtentechnik, Technische Universität Braunschweig, Schleinitzstraße 23, D-3300, Braunschweig, Deutschland
Erwin Paulus

Rights and permissions

Reprints and permissions

Copyright information

About this paper

Cite this paper

Kaltenmeier, A., Stall, D. (1987). Mehrfache phonetische Darstellung in einem Spracherkennungssystem für großen Wortschatz. In: Paulus, E. (eds) Mustererkennung 1987. Informatik-Fachberichte, vol 149. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-22205-8_26

Download citation

DOI: https://doi.org/10.1007/978-3-662-22205-8_26
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-18375-4
Online ISBN: 978-3-662-22205-8
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics