Summary
A simple function-model of the human ear is used to transfer the sound of the German spoken numbers into channel-time patterns, which are coded and fed into an electronic computer ER 56. For each number a time-normalized characteristic pattern is formed and stored in the computer. For recognition a simple matching program in the computer is used, to compare the time normalized average pattern of all 10 numbers with the individual time normalized pattern to be recognized. Using this method, 95% of more than 1000 numbers — spoken without special care — could be recognized correctly.
Similar content being viewed by others
Literatur
Bell, C. G., et al.: Reduction of speech spectra by analysis-by-synthesis techniques. J. acoust. Soc. Amer. 33, 1725 (1961).
Stevens, K. N.: Toward a model for speech recognition. J. acoust. Soc. Amer. 32, 47 (1960).
Zwicker, E.: Über ein einfaches Funktionsschema des Gehörs. Acustica 12, 22 (1962).
Terhardt, E.: Beitrag zur automatischen Erkennung gesprochener Ziffern. Kybernetik 3, 136 (1966).
Zwicker, E.: Möglichkeiten zur Spracherkennung über den Tastsinn mit Hilfe eines Funktionsmodells des Gehörs. Elektron. Rechenanl. 7, 239 (1963).
Endres, W.: Automatische Spracherkennung. Kybernetik, Brücke zwischen den Wissenschaften, 5. Aufl., S. 175. Frankfurt: Umschau 1965.
Author information
Authors and Affiliations
Additional information
Der Deutschen Forschungsgemeinschaft sei für die Unter-stützung dieser Untersuchungen gedankt.
Rights and permissions
About this article
Cite this article
Zwicker, E., Hess, W. & Terhardt, E. Erkennung gesprochener Zahlworte mit Funktionsmodell und elektronischer Rechenanlage. Kybernetik 3, 267–272 (1967). https://doi.org/10.1007/BF00271508
Received:
Issue Date:
DOI: https://doi.org/10.1007/BF00271508