Kennwortidentifikation bei niedrigem Signal-Rausch Verhältnis

Kober, Rudi; Harz, Ulrich

doi:10.1007/978-3-642-80294-2_47

Rudi Kober² &
Ulrich Harz²

Part of the book series: Informatik aktuell ((INFORMAT))

109 Accesses

Zusammenfassung

Vorgestellt wird ein Verfahren zur Kennwortidentifikation bei niedrigem Signal-Rausch-Verhältnis (SNR: 0-15dB). Die konkrete Aufgabe besteht darin, festzustellen, ob das Kennwort innerhalb von kurzen, vorselektierten Signalausschnitten vorhanden ist oder nicht. Das Verfahren basiert auf einer Repräsentation der „lauten“ Signalanteile: Diese nicht oder wenig vom Rauschen überdeckten Abschnitte sind typischerweise Vokale. Daher werden für die zu klassifizierenden Signale Vokalfolgen extrahiert und diese mit der Vokalfolge des Kennwortes verglichen. Die Erkennungsraten betragen bei Signal- Rausch-Verhältnissen (SNR) von 15dB, 8dB, und 3dB 94%, 85% und 76%. Wesentliches Merkmal des Ansatzes ist, daß die Repräsentation der Vokale auf der Beschreibung ihrer Formanten basiert und unabhängig von SNR erfolgt, so daß der hier eingesetzte regelbasierte Klassifikator nicht an unterschiedliche SNR’s angepaßt werden muß. Das für die Signalrepräsentation eingesetzte Segmentierungsverfahren findet bei additivem, weißen Rauschen auch bei sehr niedrigen SNR genaue Wortgrenzen.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 54.99; Price excludes VAT (USA)

Softcover Book: USD 69.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literatur

X. Aubert, R. Haeb-Umbach and H. Ney: Continious Mixture Densities and Linear Discriminant Analysis for Improved Context-dependent Acoustic Models, Proc. IEEE Internat. Conf. Acoust. Speech Signal Process, 1993, Vol. II, pp. 648–651.
Article Google Scholar
A. Cichocki, R. Unbehauen, Neural Networks for Optimization and Signal Processing, Stuttgart, Teubner 1993
MATH Google Scholar
Dirk Van Compernolle: Noise adaption in a hidden Markov model speech recognition system, ESAT Belgium, 1989
Google Scholar
S. Das, R. Bakis, A. Nadas, D. Nahamoo and M. Picheny, Influence of background noise and microphone on the performance of the IBM TANGORA speech recognition system, Proc. IEEE Internat. Conf. Acoust. Speech Signal Process 1993. Vol. II. pp 71–74.
Article Google Scholar
J.R. Deller, J.G. Proakis, J.H.L. Hansen, Discrete-Time Processing of Speech Signals, Macmillan Publishing Company, New York, 1993.
Google Scholar
Y. Gong, Speech recognition in noisy environments: A survey, Speech Communication 16 (1995) pp 261–291.
Google Scholar
R. Kober, J. Schiffers: Representation of Non-Rigid Objects - A Knowledge-Guided Approach, Proc. of 1st IEEE International Conference on Image Processing (ICIP 1994 ), 1994
Google Scholar
R. Kober, J. Schiffers: A Heuristic Approach to the Representation of Human Lips, FAW Ulm, Tech. Report, No., 1995
Google Scholar
P. Lockwood, J. Boudy: Experiments with a Nonlinear Spectral Subtractor (NSS), Hidden Markov Modells and the projection, for robust speech recognition in cars, Speech communication 11, pp 215–228, 1992
Google Scholar
H. Niemann, R. de Mori, G. Hanrieder, Progress and Prospects of Speech Research and Technology, CRIM/FORWISS Workshop, München, September 1994.
Google Scholar
J.A. Nolazco-Flores & S.J. Young: Adapting a HMM-based Recogniser for Noisy Speech Enhanced by Spectral Substraction, CUED/F- INFENG/TR.123, 1993
Google Scholar
S. Mizuta, K. Nakajima, Optimal discriminative training for HMMs to recognize noisy speech, Int. Conf. Speech and Language Processing, Vol. II, Banff. Alberta, Canada, pp 1519–1522, 1992
Google Scholar
L. Rabiner, B. H. Juang, Fundamentals of Speech Recognition, PTR Prentice-Hall, Inc., New Jersey, 1993.
Google Scholar
J.G. Wilpon, L.R. Rabiner, C–H Lee, E.R. Goldman, Automatic Recognition of Keywords in Unconstrained Speech Using Hidden Markov Models IEEE ASSP vol 38, No 11, 1990.
Google Scholar
S.J. Young, P.C. Woodland, W.J. Byrne: HTK: Hidden Markov Model Toolkit VI.5 Entropie Research Laboratoires Inc., 1993.
Google Scholar

Download references

Author information

Authors and Affiliations

Forschungsinstitut für anwendungsorientierte Wissensverarbeitung, Postfach 2060, D-89010, Ulm, Germany
Rudi Kober & Ulrich Harz

Authors

Rudi Kober
View author publications
You can also search for this author in PubMed Google Scholar
Ulrich Harz
View author publications
You can also search for this author in PubMed Google Scholar

Editor information

Editors and Affiliations

Interdisziplinäres Zentrum für Wissenschaftliches Rechnen Forschergruppe Bildverarbeitung, Universität Heidelberg, Im Neuenheimer Feld 368, D-69120, Heidelberg, Germany
Bernd Jähne , Peter Geißler , Horst Haußecker & Frank Hering , , &

Rights and permissions

Reprints and permissions

Copyright information

About this paper

Cite this paper

Kober, R., Harz, U. (1996). Kennwortidentifikation bei niedrigem Signal-Rausch Verhältnis. In: Jähne, B., Geißler, P., Haußecker, H., Hering, F. (eds) Mustererkennung 1996. Informatik aktuell. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-80294-2_47

Download citation

DOI: https://doi.org/10.1007/978-3-642-80294-2_47
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-61585-9
Online ISBN: 978-3-642-80294-2
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics