Optimierung eines HMM-Spracherkennungssystems

Class, F.; Kaltenmeier, A.; Regel-Brietzmann, P.; Trottler, K.

doi:10.1007/978-3-642-77809-4_9

F. Class²,
A. Kaltenmeier²,
P. Regel-Brietzmann² &
…
K. Trottler³

Part of the book series: Informatik aktuell ((INFORMAT))

55 Accesses

Zusammenfassung

Dieser Beitrag beschreibt mehrere Optimierungsschritte eines auf Hidden-Markov-Modellen basierenden Spracherkenners. Im einzelnen betrifft dies: Wortuntereinheiten, dynamische Merkmale, Vektorquantisierung sowie Größe und Art der verwendeten Co-debücher. Außerdem wird im Detail auf ein Verfahren zur schnellen Sprecheradaption eingegangen. Wir beschreiben dabei die Kombination von „Sprecheradaption durch Merkmalstransformation“ mit semi-kontinuierlichen Hidden-Markov-Modellen SCHMM [1, 5, 9, 10]. Da in einem solchen Erkennungssystem die Sprache eines Referenzsprechers nicht explizit in Form von Merkmals Vektoren, sondern nur in Form mehrdimensionaler Normalverteilungen vorliegt, müssen diese Verteilungen an Stelle der Merkmalsvektoren transformiert werden.

Das diesem Beitrag sugrundeliegende Vorhaben wurde teilweise mit Mitteln des Bundesministers für Forschung und Technologie unter dem Förderkennseichen FKZ 01 IV 102 E gefördert. Die Verantwortung für den Inhalt dieser Veröffentlichung liegen bei den Autoren.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 49.99; Price excludes VAT (USA)

Softcover Book: USD 59.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literaturverzeichnis

F. Class, A. Kaltenraeier, P. Regel: Soft-Decision Vector Quantization based on the Dempster/Shafer Theory. ICASSP ’91, Toronto, Canada, pp. 665–668.
Google Scholar
F. Class, A. Kaltenmeier, P. Regel, K. Trottler: Fast Speaker Adaptation for Speech Recognition Systems. ICASSP ’90, Albuquerque, April 90, pp. 133–136.
Google Scholar
F. Class et al.: Speaker Adaptation for Recognition Systems with a Large Vocabulary. Proc. of MELECON ’89, April 1989, Lissabon, pp. 241–244.
Google Scholar
F. Class: Standardisierung von Sprachmustern durch vokabular-invariante Abbildungen zur Anpassung an Spracherkennungssysteme. Fortschrittbelichte VDI, Reihe 10, Nr.131; VDI-Verlag Düsseldorf.
Google Scholar
X. D. Huang, M. A. Jack: Semi-continuous hidden Markov models for speech signals. Computer Speech and Language, Vol. 3, 1989, pp. 239–251.
Article Google Scholar
A. Kaltenmeier, E. Mandler: Vektorquantisierung mit klassenspezifischer Abstandsmodellierung bei der Schätzung der Emissionswahrscheinlichkeiten von Hidden-Markov-Modellen. Digitale Sprachverarbeitung- Prinzipien und Anwendung, VDE-Verlag GmbH, Berlin, 1988, S. 105–110.
Google Scholar
K.Choukri, G.Chollet, Y.Grenier: Spectral Transformations through Canonical Correlation Analysis for Speaker adaptation in ASR. ICASSP86, 1986, S. 2695–2662.
Google Scholar
Y. Linde, A. Buzo, R.M. Gray: An Algorithmfor Vector Quantizer Design, IEEE Trans. COM, Vol. 28, No. 1, Jan. 1980, pp. 84–95.
Article Google Scholar
L.R. Rabiner: A tutorial on Hidden Markov Models and Selected Applications in Speech Recognition, Proc. IEEE, Vol. 77, No. 2, Febr. 1989, pp. 257–285.
Article Google Scholar
F.Class, H.Katterfeldt, P.Regel: Methoden und Algorithmen der Worterkennung, in H. Mangold(Hrsg.): Sprachliche Mensch-Maschine-Kommunikation. Oldenbourg Verlag, München, 1991, S. 1–13.
Google Scholar
F. Class, A. Kaltenmeier, P. Regel-Brietzmann, K. Trottler: Fast Speaker Adaptation Combined with Soft Vector Quantization in an HMM Speech Recognition System. ICASSP ’92, San Francisco, 1992, Session 55.8.
Google Scholar
F. Class: Standardisierung von Sprachmustem durch vokabular-invariante Abbildungen zur Anpassung an Spracherkennungssysteme. Dissertation. Fortschrittberichte VDI, Reihe 10: Informatik/Komm.techn., Nr. 131; VDI-Verlag.
Google Scholar

Download references

Author information

Authors and Affiliations

Daimler-Benz AG, Forschungsinstitut Ulm, 7900, Ulm, Germany
F. Class, A. Kaltenmeier & P. Regel-Brietzmann
Telefunken Systemtechnik, Sedanstr. 10, 7900, Ulm, Germany
K. Trottler

Authors

F. Class
View author publications
You can also search for this author in PubMed Google Scholar
A. Kaltenmeier
View author publications
You can also search for this author in PubMed Google Scholar
P. Regel-Brietzmann
View author publications
You can also search for this author in PubMed Google Scholar
K. Trottler
View author publications
You can also search for this author in PubMed Google Scholar

Editor information

Editors and Affiliations

Informatik (IMMD) VIII und FORWISS Erlangen, Universität Erlangen-Nürnberg, Am Weichselgarten 9, W-8520, Erlangen, Germany
Günther Görz

Rights and permissions

Reprints and permissions

Copyright information

About this paper

Cite this paper

Class, F., Kaltenmeier, A., Regel-Brietzmann, P., Trottler, K. (1992). Optimierung eines HMM-Spracherkennungssystems. In: Görz, G. (eds) Konvens 92. Informatik aktuell. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-77809-4_9

Download citation

DOI: https://doi.org/10.1007/978-3-642-77809-4_9
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-55959-7
Online ISBN: 978-3-642-77809-4
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics