Skip to main content

Kennwortidentifikation bei niedrigem Signal-Rausch Verhältnis

  • Conference paper
Mustererkennung 1996

Part of the book series: Informatik aktuell ((INFORMAT))

  • 109 Accesses

Zusammenfassung

Vorgestellt wird ein Verfahren zur Kennwortidentifikation bei niedrigem Signal-Rausch-Verhältnis (SNR: 0-15dB). Die konkrete Aufgabe besteht darin, festzustellen, ob das Kennwort innerhalb von kurzen, vorselektierten Signalausschnitten vorhanden ist oder nicht. Das Verfahren basiert auf einer Repräsentation der „lauten“ Signalanteile: Diese nicht oder wenig vom Rauschen überdeckten Abschnitte sind typischerweise Vokale. Daher werden für die zu klassifizierenden Signale Vokalfolgen extrahiert und diese mit der Vokalfolge des Kennwortes verglichen. Die Erkennungsraten betragen bei Signal- Rausch-Verhältnissen (SNR) von 15dB, 8dB, und 3dB 94%, 85% und 76%. Wesentliches Merkmal des Ansatzes ist, daß die Repräsentation der Vokale auf der Beschreibung ihrer Formanten basiert und unabhängig von SNR erfolgt, so daß der hier eingesetzte regelbasierte Klassifikator nicht an unterschiedliche SNR’s angepaßt werden muß. Das für die Signalrepräsentation eingesetzte Segmentierungsverfahren findet bei additivem, weißen Rauschen auch bei sehr niedrigen SNR genaue Wortgrenzen.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 54.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 69.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. X. Aubert, R. Haeb-Umbach and H. Ney: Continious Mixture Densities and Linear Discriminant Analysis for Improved Context-dependent Acoustic Models, Proc. IEEE Internat. Conf. Acoust. Speech Signal Process, 1993, Vol. II, pp. 648–651.

    Article  Google Scholar 

  2. A. Cichocki, R. Unbehauen, Neural Networks for Optimization and Signal Processing, Stuttgart, Teubner 1993

    MATH  Google Scholar 

  3. Dirk Van Compernolle: Noise adaption in a hidden Markov model speech recognition system, ESAT Belgium, 1989

    Google Scholar 

  4. S. Das, R. Bakis, A. Nadas, D. Nahamoo and M. Picheny, Influence of background noise and microphone on the performance of the IBM TANGORA speech recognition system, Proc. IEEE Internat. Conf. Acoust. Speech Signal Process 1993. Vol. II. pp 71–74.

    Article  Google Scholar 

  5. J.R. Deller, J.G. Proakis, J.H.L. Hansen, Discrete-Time Processing of Speech Signals, Macmillan Publishing Company, New York, 1993.

    Google Scholar 

  6. Y. Gong, Speech recognition in noisy environments: A survey, Speech Communication 16 (1995) pp 261–291.

    Google Scholar 

  7. R. Kober, J. Schiffers: Representation of Non-Rigid Objects - A Knowledge-Guided Approach, Proc. of 1st IEEE International Conference on Image Processing (ICIP 1994 ), 1994

    Google Scholar 

  8. R. Kober, J. Schiffers: A Heuristic Approach to the Representation of Human Lips, FAW Ulm, Tech. Report, No., 1995

    Google Scholar 

  9. P. Lockwood, J. Boudy: Experiments with a Nonlinear Spectral Subtractor (NSS), Hidden Markov Modells and the projection, for robust speech recognition in cars, Speech communication 11, pp 215–228, 1992

    Google Scholar 

  10. H. Niemann, R. de Mori, G. Hanrieder, Progress and Prospects of Speech Research and Technology, CRIM/FORWISS Workshop, München, September 1994.

    Google Scholar 

  11. J.A. Nolazco-Flores & S.J. Young: Adapting a HMM-based Recogniser for Noisy Speech Enhanced by Spectral Substraction, CUED/F- INFENG/TR.123, 1993

    Google Scholar 

  12. S. Mizuta, K. Nakajima, Optimal discriminative training for HMMs to recognize noisy speech, Int. Conf. Speech and Language Processing, Vol. II, Banff. Alberta, Canada, pp 1519–1522, 1992

    Google Scholar 

  13. L. Rabiner, B. H. Juang, Fundamentals of Speech Recognition, PTR Prentice-Hall, Inc., New Jersey, 1993.

    Google Scholar 

  14. J.G. Wilpon, L.R. Rabiner, C–H Lee, E.R. Goldman, Automatic Recognition of Keywords in Unconstrained Speech Using Hidden Markov Models IEEE ASSP vol 38, No 11, 1990.

    Google Scholar 

  15. S.J. Young, P.C. Woodland, W.J. Byrne: HTK: Hidden Markov Model Toolkit VI.5 Entropie Research Laboratoires Inc., 1993.

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 1996 Springer-Verlag Berlin Heidelberg

About this paper

Cite this paper

Kober, R., Harz, U. (1996). Kennwortidentifikation bei niedrigem Signal-Rausch Verhältnis. In: Jähne, B., Geißler, P., Haußecker, H., Hering, F. (eds) Mustererkennung 1996. Informatik aktuell. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-80294-2_47

Download citation

  • DOI: https://doi.org/10.1007/978-3-642-80294-2_47

  • Publisher Name: Springer, Berlin, Heidelberg

  • Print ISBN: 978-3-540-61585-9

  • Online ISBN: 978-3-642-80294-2

  • eBook Packages: Springer Book Archive

Publish with us

Policies and ethics