Skip to main content

Optimierung eines HMM-Spracherkennungssystems

  • Conference paper
Konvens 92

Part of the book series: Informatik aktuell ((INFORMAT))

  • 55 Accesses

Zusammenfassung

Dieser Beitrag beschreibt mehrere Optimierungsschritte eines auf Hidden-Markov-Modellen basierenden Spracherkenners. Im einzelnen betrifft dies: Wortuntereinheiten, dynamische Merkmale, Vektorquantisierung sowie Größe und Art der verwendeten Co-debücher. Außerdem wird im Detail auf ein Verfahren zur schnellen Sprecheradaption eingegangen. Wir beschreiben dabei die Kombination von „Sprecheradaption durch Merkmalstransformation“ mit semi-kontinuierlichen Hidden-Markov-Modellen SCHMM [1, 5, 9, 10]. Da in einem solchen Erkennungssystem die Sprache eines Referenzsprechers nicht explizit in Form von Merkmals Vektoren, sondern nur in Form mehrdimensionaler Normalverteilungen vorliegt, müssen diese Verteilungen an Stelle der Merkmalsvektoren transformiert werden.

Das diesem Beitrag sugrundeliegende Vorhaben wurde teilweise mit Mitteln des Bundesministers für Forschung und Technologie unter dem Förderkennseichen FKZ 01 IV 102 E gefördert. Die Verantwortung für den Inhalt dieser Veröffentlichung liegen bei den Autoren.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 49.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 59.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literaturverzeichnis

  1. F. Class, A. Kaltenraeier, P. Regel: Soft-Decision Vector Quantization based on the Dempster/Shafer Theory. ICASSP ’91, Toronto, Canada, pp. 665–668.

    Google Scholar 

  2. F. Class, A. Kaltenmeier, P. Regel, K. Trottler: Fast Speaker Adaptation for Speech Recognition Systems. ICASSP ’90, Albuquerque, April 90, pp. 133–136.

    Google Scholar 

  3. F. Class et al.: Speaker Adaptation for Recognition Systems with a Large Vocabulary. Proc. of MELECON ’89, April 1989, Lissabon, pp. 241–244.

    Google Scholar 

  4. F. Class: Standardisierung von Sprachmustern durch vokabular-invariante Abbildungen zur Anpassung an Spracherkennungssysteme. Fortschrittbelichte VDI, Reihe 10, Nr.131; VDI-Verlag Düsseldorf.

    Google Scholar 

  5. X. D. Huang, M. A. Jack: Semi-continuous hidden Markov models for speech signals. Computer Speech and Language, Vol. 3, 1989, pp. 239–251.

    Article  Google Scholar 

  6. A. Kaltenmeier, E. Mandler: Vektorquantisierung mit klassenspezifischer Abstandsmodellierung bei der Schätzung der Emissionswahrscheinlichkeiten von Hidden-Markov-Modellen. Digitale Sprachverarbeitung- Prinzipien und Anwendung, VDE-Verlag GmbH, Berlin, 1988, S. 105–110.

    Google Scholar 

  7. K.Choukri, G.Chollet, Y.Grenier: Spectral Transformations through Canonical Correlation Analysis for Speaker adaptation in ASR. ICASSP86, 1986, S. 2695–2662.

    Google Scholar 

  8. Y. Linde, A. Buzo, R.M. Gray: An Algorithmfor Vector Quantizer Design, IEEE Trans. COM, Vol. 28, No. 1, Jan. 1980, pp. 84–95.

    Article  Google Scholar 

  9. L.R. Rabiner: A tutorial on Hidden Markov Models and Selected Applications in Speech Recognition, Proc. IEEE, Vol. 77, No. 2, Febr. 1989, pp. 257–285.

    Article  Google Scholar 

  10. F.Class, H.Katterfeldt, P.Regel: Methoden und Algorithmen der Worterkennung, in H. Mangold(Hrsg.): Sprachliche Mensch-Maschine-Kommunikation. Oldenbourg Verlag, München, 1991, S. 1–13.

    Google Scholar 

  11. F. Class, A. Kaltenmeier, P. Regel-Brietzmann, K. Trottler: Fast Speaker Adaptation Combined with Soft Vector Quantization in an HMM Speech Recognition System. ICASSP ’92, San Francisco, 1992, Session 55.8.

    Google Scholar 

  12. F. Class: Standardisierung von Sprachmustem durch vokabular-invariante Abbildungen zur Anpassung an Spracherkennungssysteme. Dissertation. Fortschrittberichte VDI, Reihe 10: Informatik/Komm.techn., Nr. 131; VDI-Verlag.

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 1992 Springer-Verlag Berlin Heidelberg

About this paper

Cite this paper

Class, F., Kaltenmeier, A., Regel-Brietzmann, P., Trottler, K. (1992). Optimierung eines HMM-Spracherkennungssystems. In: Görz, G. (eds) Konvens 92. Informatik aktuell. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-77809-4_9

Download citation

  • DOI: https://doi.org/10.1007/978-3-642-77809-4_9

  • Publisher Name: Springer, Berlin, Heidelberg

  • Print ISBN: 978-3-540-55959-7

  • Online ISBN: 978-3-642-77809-4

  • eBook Packages: Springer Book Archive

Publish with us

Policies and ethics