Kontextabhängige Segmentmodelle für fließende Sprache

Kalveram, Hans

doi:10.1007/978-3-642-76062-4_9

Hans Kalveram³

Part of the book series: Informatik-Fachberichte ((INFORMATIK,volume 253))

85 Accesses

Zusammenfassung

Sprachsignale erfordern eine sehr differenzierte stochastische Modellbildung, die insbesondere die Variationen der momentanen spektralen Leistungsdichte einbeziehen muß. Hidden- Markov-Modelle leisten dies, indem von den beobachtbaren Signaleigenschaften eines Analysefensters angenommen wird, daß sie von einer verdeckten, dem Beobachter nicht zugänglichen Markov-Zustandsfolge abhängen. In den geschätzten Modellparametern spiegeln sich akustisch-phonetische Strukturen von Sprachsignalen wider [4]. In der Spracherkennung haben sich Hidden-Markov-Modelle gerade aus diesem Grunde bewährt, denn es braucht bei ihnen nur wenig Wissen über die akustisch-phonetische Struktur der Sprache explizit eingebracht zu werden.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 54.99; Price excludes VAT (USA)

Softcover Book: USD 69.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literatur

L. R. Bahl, F. Jelineck, R.L. Mercer, “A Maximum Likelihood approach to continuous speech recognition”, IEEE Trans. Pattern Anal, and Machine Intell. PAMI-5 (1983), 179–190.
Article Google Scholar
J. K. Baker, “The dragon system — an overview”, IEEE Trans. ASSP, ASSP-23 (1975), 24–29.
Article Google Scholar
Y. L. Chow et al., „The role of word-dependent coarticulation effects in a phoneme-based speech recognition system.” Proc. ICASSP Tokio, April 1986, 1593–1596.
Google Scholar
S. Ergezinger, H. Kalveram, P. Meissner, „Segmentation of Speech Signals based on Hidden Markov Models”, Signal Processing IV: Theories and Applications, Hrsg. J. L. Lacoume et al., Elsevier Science Publishers B.V. (North-Holland), 1988, S. 555–558.
Google Scholar
M.-Y. Hwang, H.-W. Hon, K.-F. Lee, „Modeling between-word coarticulation in continuous speech recognition” European Conf. on Speech Comm. and Technology, Paris 1989, Band 1, 5–8.
Google Scholar
H. Kalveram, P. Meissner, „Mehrstufige Modelle für segmentierte Sprachsignale”, Abschlußbericht, November 1989, gefordert im DFG-Schwerpunktprogramm „Digitale Signalverarbeitung”.
Google Scholar
K.-F. Lee, „Automatic Speech Recognition, The Development of the SPHINX System” Kluwer Academic Publishers, Boston, 1989.
Google Scholar
K.-F. Lee, „Speaker-independent phone recognition using Hidden Markov Models” IEEE Trans. ASSP, ASSP-37 (1989), 1641–1648.
Article Google Scholar
P. Meissner, H. Kalveram, „Funktionen über Markovketten als stochastische Modelle für die Grobstruktur von Sprachsignalen”, 5. Aachener Kolloquium Math. Methoden in der Signalverarb., 1984, S. 304–307.
Google Scholar
L. R. Rabiner, „A Tutorial on Hidden Markov Models and selected applications in speech recognition” Proc. of the IEEE 77 (1989), 257–285.
Article Google Scholar
R. Schwartz, Y. Chow, O. Kimball, S. Roucos, M. Krasner, J. Makhoul, „Context-dependent modeling for akustic-phonetic recognition of continuous speech”, Proc. ICASSP 1985, 1205–1208.
Google Scholar

Download references

Author information

Authors and Affiliations

Institut für Allgemeine Nachrichtentechnik, Universität Hannover, Appelstr. 9A, D-3000, Hannover 1, Deutschland
Hans Kalveram

Authors

Hans Kalveram
View author publications
You can also search for this author in PubMed Google Scholar

Editor information

Editors and Affiliations

Rogowski-Institut für Elektrotechnik, Lehrstuhl für Allgemeine Elektrotechnik und Datenverarbeitungssysteme, RWTH Aachen, Schinkelstraße 2, D-5100, Aachen, Deutschland
W. Ameling

Rights and permissions

Reprints and permissions

Copyright information

About this paper

Cite this paper

Kalveram, H. (1990). Kontextabhängige Segmentmodelle für fließende Sprache. In: Ameling, W. (eds) ASST ’90 7. Aachener Symposium für Signaltheorie. Informatik-Fachberichte, vol 253. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-76062-4_9

Download citation

DOI: https://doi.org/10.1007/978-3-642-76062-4_9
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-53124-1
Online ISBN: 978-3-642-76062-4
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics