Zusammenfassung
Dieser Beitrag beschreibt mehrere Optimierungsschritte eines auf Hidden-Markov-Modellen basierenden Spracherkenners. Im einzelnen betrifft dies: Wortuntereinheiten, dynamische Merkmale, Vektorquantisierung sowie Größe und Art der verwendeten Co-debücher. Außerdem wird im Detail auf ein Verfahren zur schnellen Sprecheradaption eingegangen. Wir beschreiben dabei die Kombination von „Sprecheradaption durch Merkmalstransformation“ mit semi-kontinuierlichen Hidden-Markov-Modellen SCHMM [1, 5, 9, 10]. Da in einem solchen Erkennungssystem die Sprache eines Referenzsprechers nicht explizit in Form von Merkmals Vektoren, sondern nur in Form mehrdimensionaler Normalverteilungen vorliegt, müssen diese Verteilungen an Stelle der Merkmalsvektoren transformiert werden.
Das diesem Beitrag sugrundeliegende Vorhaben wurde teilweise mit Mitteln des Bundesministers für Forschung und Technologie unter dem Förderkennseichen FKZ 01 IV 102 E gefördert. Die Verantwortung für den Inhalt dieser Veröffentlichung liegen bei den Autoren.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literaturverzeichnis
F. Class, A. Kaltenraeier, P. Regel: Soft-Decision Vector Quantization based on the Dempster/Shafer Theory. ICASSP ’91, Toronto, Canada, pp. 665–668.
F. Class, A. Kaltenmeier, P. Regel, K. Trottler: Fast Speaker Adaptation for Speech Recognition Systems. ICASSP ’90, Albuquerque, April 90, pp. 133–136.
F. Class et al.: Speaker Adaptation for Recognition Systems with a Large Vocabulary. Proc. of MELECON ’89, April 1989, Lissabon, pp. 241–244.
F. Class: Standardisierung von Sprachmustern durch vokabular-invariante Abbildungen zur Anpassung an Spracherkennungssysteme. Fortschrittbelichte VDI, Reihe 10, Nr.131; VDI-Verlag Düsseldorf.
X. D. Huang, M. A. Jack: Semi-continuous hidden Markov models for speech signals. Computer Speech and Language, Vol. 3, 1989, pp. 239–251.
A. Kaltenmeier, E. Mandler: Vektorquantisierung mit klassenspezifischer Abstandsmodellierung bei der Schätzung der Emissionswahrscheinlichkeiten von Hidden-Markov-Modellen. Digitale Sprachverarbeitung- Prinzipien und Anwendung, VDE-Verlag GmbH, Berlin, 1988, S. 105–110.
K.Choukri, G.Chollet, Y.Grenier: Spectral Transformations through Canonical Correlation Analysis for Speaker adaptation in ASR. ICASSP86, 1986, S. 2695–2662.
Y. Linde, A. Buzo, R.M. Gray: An Algorithmfor Vector Quantizer Design, IEEE Trans. COM, Vol. 28, No. 1, Jan. 1980, pp. 84–95.
L.R. Rabiner: A tutorial on Hidden Markov Models and Selected Applications in Speech Recognition, Proc. IEEE, Vol. 77, No. 2, Febr. 1989, pp. 257–285.
F.Class, H.Katterfeldt, P.Regel: Methoden und Algorithmen der Worterkennung, in H. Mangold(Hrsg.): Sprachliche Mensch-Maschine-Kommunikation. Oldenbourg Verlag, München, 1991, S. 1–13.
F. Class, A. Kaltenmeier, P. Regel-Brietzmann, K. Trottler: Fast Speaker Adaptation Combined with Soft Vector Quantization in an HMM Speech Recognition System. ICASSP ’92, San Francisco, 1992, Session 55.8.
F. Class: Standardisierung von Sprachmustem durch vokabular-invariante Abbildungen zur Anpassung an Spracherkennungssysteme. Dissertation. Fortschrittberichte VDI, Reihe 10: Informatik/Komm.techn., Nr. 131; VDI-Verlag.
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1992 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Class, F., Kaltenmeier, A., Regel-Brietzmann, P., Trottler, K. (1992). Optimierung eines HMM-Spracherkennungssystems. In: Görz, G. (eds) Konvens 92. Informatik aktuell. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-77809-4_9
Download citation
DOI: https://doi.org/10.1007/978-3-642-77809-4_9
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-55959-7
Online ISBN: 978-3-642-77809-4
eBook Packages: Springer Book Archive