Zusammenfassung
Vorgestellt wird ein Verfahren zur Kennwortidentifikation bei niedrigem Signal-Rausch-Verhältnis (SNR: 0-15dB). Die konkrete Aufgabe besteht darin, festzustellen, ob das Kennwort innerhalb von kurzen, vorselektierten Signalausschnitten vorhanden ist oder nicht. Das Verfahren basiert auf einer Repräsentation der „lauten“ Signalanteile: Diese nicht oder wenig vom Rauschen überdeckten Abschnitte sind typischerweise Vokale. Daher werden für die zu klassifizierenden Signale Vokalfolgen extrahiert und diese mit der Vokalfolge des Kennwortes verglichen. Die Erkennungsraten betragen bei Signal- Rausch-Verhältnissen (SNR) von 15dB, 8dB, und 3dB 94%, 85% und 76%. Wesentliches Merkmal des Ansatzes ist, daß die Repräsentation der Vokale auf der Beschreibung ihrer Formanten basiert und unabhängig von SNR erfolgt, so daß der hier eingesetzte regelbasierte Klassifikator nicht an unterschiedliche SNR’s angepaßt werden muß. Das für die Signalrepräsentation eingesetzte Segmentierungsverfahren findet bei additivem, weißen Rauschen auch bei sehr niedrigen SNR genaue Wortgrenzen.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
X. Aubert, R. Haeb-Umbach and H. Ney: Continious Mixture Densities and Linear Discriminant Analysis for Improved Context-dependent Acoustic Models, Proc. IEEE Internat. Conf. Acoust. Speech Signal Process, 1993, Vol. II, pp. 648–651.
A. Cichocki, R. Unbehauen, Neural Networks for Optimization and Signal Processing, Stuttgart, Teubner 1993
Dirk Van Compernolle: Noise adaption in a hidden Markov model speech recognition system, ESAT Belgium, 1989
S. Das, R. Bakis, A. Nadas, D. Nahamoo and M. Picheny, Influence of background noise and microphone on the performance of the IBM TANGORA speech recognition system, Proc. IEEE Internat. Conf. Acoust. Speech Signal Process 1993. Vol. II. pp 71–74.
J.R. Deller, J.G. Proakis, J.H.L. Hansen, Discrete-Time Processing of Speech Signals, Macmillan Publishing Company, New York, 1993.
Y. Gong, Speech recognition in noisy environments: A survey, Speech Communication 16 (1995) pp 261–291.
R. Kober, J. Schiffers: Representation of Non-Rigid Objects - A Knowledge-Guided Approach, Proc. of 1st IEEE International Conference on Image Processing (ICIP 1994 ), 1994
R. Kober, J. Schiffers: A Heuristic Approach to the Representation of Human Lips, FAW Ulm, Tech. Report, No., 1995
P. Lockwood, J. Boudy: Experiments with a Nonlinear Spectral Subtractor (NSS), Hidden Markov Modells and the projection, for robust speech recognition in cars, Speech communication 11, pp 215–228, 1992
H. Niemann, R. de Mori, G. Hanrieder, Progress and Prospects of Speech Research and Technology, CRIM/FORWISS Workshop, München, September 1994.
J.A. Nolazco-Flores & S.J. Young: Adapting a HMM-based Recogniser for Noisy Speech Enhanced by Spectral Substraction, CUED/F- INFENG/TR.123, 1993
S. Mizuta, K. Nakajima, Optimal discriminative training for HMMs to recognize noisy speech, Int. Conf. Speech and Language Processing, Vol. II, Banff. Alberta, Canada, pp 1519–1522, 1992
L. Rabiner, B. H. Juang, Fundamentals of Speech Recognition, PTR Prentice-Hall, Inc., New Jersey, 1993.
J.G. Wilpon, L.R. Rabiner, C–H Lee, E.R. Goldman, Automatic Recognition of Keywords in Unconstrained Speech Using Hidden Markov Models IEEE ASSP vol 38, No 11, 1990.
S.J. Young, P.C. Woodland, W.J. Byrne: HTK: Hidden Markov Model Toolkit VI.5 Entropie Research Laboratoires Inc., 1993.
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1996 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Kober, R., Harz, U. (1996). Kennwortidentifikation bei niedrigem Signal-Rausch Verhältnis. In: Jähne, B., Geißler, P., Haußecker, H., Hering, F. (eds) Mustererkennung 1996. Informatik aktuell. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-80294-2_47
Download citation
DOI: https://doi.org/10.1007/978-3-642-80294-2_47
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-61585-9
Online ISBN: 978-3-642-80294-2
eBook Packages: Springer Book Archive