Zusammenfassung
Sprachsignale erfordern eine sehr differenzierte stochastische Modellbildung, die insbesondere die Variationen der momentanen spektralen Leistungsdichte einbeziehen muß. Hidden- Markov-Modelle leisten dies, indem von den beobachtbaren Signaleigenschaften eines Analysefensters angenommen wird, daß sie von einer verdeckten, dem Beobachter nicht zugänglichen Markov-Zustandsfolge abhängen. In den geschätzten Modellparametern spiegeln sich akustisch-phonetische Strukturen von Sprachsignalen wider [4]. In der Spracherkennung haben sich Hidden-Markov-Modelle gerade aus diesem Grunde bewährt, denn es braucht bei ihnen nur wenig Wissen über die akustisch-phonetische Struktur der Sprache explizit eingebracht zu werden.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
L. R. Bahl, F. Jelineck, R.L. Mercer, “A Maximum Likelihood approach to continuous speech recognition”, IEEE Trans. Pattern Anal, and Machine Intell. PAMI-5 (1983), 179–190.
J. K. Baker, “The dragon system — an overview”, IEEE Trans. ASSP, ASSP-23 (1975), 24–29.
Y. L. Chow et al., „The role of word-dependent coarticulation effects in a phoneme-based speech recognition system.” Proc. ICASSP Tokio, April 1986, 1593–1596.
S. Ergezinger, H. Kalveram, P. Meissner, „Segmentation of Speech Signals based on Hidden Markov Models”, Signal Processing IV: Theories and Applications, Hrsg. J. L. Lacoume et al., Elsevier Science Publishers B.V. (North-Holland), 1988, S. 555–558.
M.-Y. Hwang, H.-W. Hon, K.-F. Lee, „Modeling between-word coarticulation in continuous speech recognition” European Conf. on Speech Comm. and Technology, Paris 1989, Band 1, 5–8.
H. Kalveram, P. Meissner, „Mehrstufige Modelle für segmentierte Sprachsignale”, Abschlußbericht, November 1989, gefordert im DFG-Schwerpunktprogramm „Digitale Signalverarbeitung”.
K.-F. Lee, „Automatic Speech Recognition, The Development of the SPHINX System” Kluwer Academic Publishers, Boston, 1989.
K.-F. Lee, „Speaker-independent phone recognition using Hidden Markov Models” IEEE Trans. ASSP, ASSP-37 (1989), 1641–1648.
P. Meissner, H. Kalveram, „Funktionen über Markovketten als stochastische Modelle für die Grobstruktur von Sprachsignalen”, 5. Aachener Kolloquium Math. Methoden in der Signalverarb., 1984, S. 304–307.
L. R. Rabiner, „A Tutorial on Hidden Markov Models and selected applications in speech recognition” Proc. of the IEEE 77 (1989), 257–285.
R. Schwartz, Y. Chow, O. Kimball, S. Roucos, M. Krasner, J. Makhoul, „Context-dependent modeling for akustic-phonetic recognition of continuous speech”, Proc. ICASSP 1985, 1205–1208.
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1990 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Kalveram, H. (1990). Kontextabhängige Segmentmodelle für fließende Sprache. In: Ameling, W. (eds) ASST ’90 7. Aachener Symposium für Signaltheorie. Informatik-Fachberichte, vol 253. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-76062-4_9
Download citation
DOI: https://doi.org/10.1007/978-3-642-76062-4_9
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-53124-1
Online ISBN: 978-3-642-76062-4
eBook Packages: Springer Book Archive