Zusammenfassung
Dieser Beitrag beschreibt ein zweistufiges Verfahren zur Generierung und Verifikation von Worthypothesen in Spracherkennungssystemen mit großem Wortschatz. Dieses Verfahren wird implementiert in einem sprachverstehenden System für kontinuierliche Sprache, das im ESPRIT Projekt Nr. 26 entwickelt wird. Das Ziel des Projekts ist die Realisierung eines Demonstrationssystems für ein Vokabular von etwa 1000 Wörtern; die Zielsetzung ist ähnlich wie beim SPICOS-Projekt. Wegen des Umfangs des Wortschatzes muß die Spracherkennung in solchen Systemen auf phonetischen Einheiten beruhen, die kleiner als Wörter sind. Wegen der natürlichen kontinuierlichen Sprechweise müssen für jedes Wort neben der Standardaussprache auch alle üblichen durch Koartikuation und natürliche Verschleifung entstehenden Aussprachevarianten berücksichtigt werden.
Das Wortlexikon enthält für jede der beiden Stufen des Systems eine eigene phonetische Darstellung: eine grobe phonetische Beschreibung (GPB) für die Generierung und eine feine phonetische Beschreibung (FPB) für die Verifikation von Worthypothesen. Beide Beschreibungen einschließlich der Aussprachevarianten werden automatisch nach Regeln aus einer einzigen Stammbeschreibung erzeugt und als Graphen implementiert.
This is a preview of subscription content, log in via an institution.
Buying options
Tax calculation will be finalised at checkout
Purchases are for personal use only
Learn about institutional subscriptionsPreview
Unable to display preview. Download preview PDF.
Literatur
H. Hoge, H. Ney: Architektur des sprachverstehenden Systems SPICOS URSI, Kleinheubacher Berichte, Okt. 1985
R. Mühlfeld: Verifikation von Worthypothesen Dissertation, Univ. Erlangen-Nürnberg, Arbeitsberichte des IMMD Band 19, Nr. 4, Erlangen, Juni 1986
M. Cravero, R. Pieraccini, F. Raineri: Definition of Recognition Units Through Two Levels of Phonemic Description Montreal Symposium on Speech Recognition, Juli 1986, pp. 53–54
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1987 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Kaltenmeier, A., Stall, D. (1987). Mehrfache phonetische Darstellung in einem Spracherkennungssystem für großen Wortschatz. In: Paulus, E. (eds) Mustererkennung 1987. Informatik-Fachberichte, vol 149. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-22205-8_26
Download citation
DOI: https://doi.org/10.1007/978-3-662-22205-8_26
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-18375-4
Online ISBN: 978-3-662-22205-8
eBook Packages: Springer Book Archive