Elsevier

Speech Communication

Volume 4, Issues 1–3, August 1985, Pages 237-245
Speech Communication

Production and perception of an articulatory continuum for fricatives of English

https://doi.org/10.1016/0167-6393(85)90050-0Get rights and content

Abstract

Simple articulatory contrasts for a phonological opposition generate a multiplicity of acoustic cues. Knowledge of the covariations of acoustic pattern features within and across speakers is needed for automatic speech recognition. A model of speech production processes was used to generate stimuli along an articulatory continuum, the degree of abduction of the vocal folds for the fricatives in English words “hiss” and “his”. Transition times imposed strong constraints on the articulatory plans devised as inputs to the model. Acoustic segment durations output from the model covaried in the same way as those produced by 5 real speakers; there was good quantitative agreement in most cases. Listeners' responses suggest that the articulatory dimension synthesised is a suitable one for natural speech. Future directions for the modelling of multiple articulatory dimensions and for mapping from speaker-specific patterns of articulation and their perturbations onto the stability of particular acoustic cues are discussed.

Zusammenfassung

Einfache artikulatorische Kontraste auf der Ebene der phonologischen Opposition bedeuten eine Vielfalt akustischer Kenzeichen. Für die automatische Spracherkennung sind Kentnisse über intra- und inter-individuelle Kovariationen akustischer Mustermerkmale erforderlich. Mit Hilfe eines traktanalogen Synthetisators wurden nach dem Grad der Abduktion der Stimmlippen für die Frikative in den englischen Wörtern “hiss” und “his” kontinuierliche Stimuli erstellt. Den Artikulationsanweisungen, die als Eingabe in das Modell dienten, waren durch die Dauer der Transitionen erhebliche Beschränkungen auferlegt. Die Dauerverhältnisse der akustischen Segmente am Modellausgang kovariierten in derselben Weise wie die Dauerverhältnisse von Segmenten in natürlichen Proben von fünf Sprechern; in den meisten Fällen zeigte sich gute quantitative Übereinstimmung. Hörerurteile lassen darauf schlieβen, daβ die synthetisierte artikulatorische Dimension die natürlichen Verhältnisse angemessen abbildet. Schlieβlich werden zukünftige Wege der Modellierung multipler artikulatorischer Dimensionen sowie der genauen Beschreibung von sprecherspezifischen Artikulationsmustern und ihren Veränderungen in ihren Auswirkungen auf die Stabilität bestimmter akustischer Merkmale besprochen.

Résumé

Des contrastes articulatoires simples pour une seule opposition phonologique génèrent une multiplicité d'indices acoustiques. La connaissance des covariations des traits de configurations acoustiques inter- et intra-locuteurs sont nécessaires pour la reconnaissance automatique de la parole. Un modèle des processus de production de la parole a été utilisé pour générer des stimuli suivant un continuum articulatoire: le degré d'abduction des cordes vocales pour les fricatives dans les mots anglais “hiss” et “his”. Les durées de transition imposent de fortes contraintes sur les schémas articulatoires servant d'entrées au modèle. Les durées des segments acoustiques produits par le modèle co-varient de manière semblable à celles produites par 5 locuteurs; un bon accord quantitatif a été observé dans la plupart des cas. Les réponses des auditeurs indiquent que la dimension articulatoire synthétisée est appropriée à la parole naturelle. Finalement, sont discutées des approches futures pour la modélisation des dimensions articulatoires multiples et pour la mise en correspondance de configurations articulatoires spécifiques au locuteur et leurs perturbation avec la stabilité d'indices acoustiques particuliers.

References (17)

  • R. Kagaya

    A fiberscopic and acoustic study of the Korean stops, affricates and fricatives

    J. Phonetics

    (1974)
  • C. Scully et al.

    Simulation of singing with a composite model of speech production

  • P. Delattre

    From acoustic cues to distinctive features

    Phonetica

    (1968)
  • I.H. Slis et al.

    On the complex regulating the voiced-voiceless distinction

    Language and Speech

    (1969)
    I.H. Slis et al.

    On the complex regulating the voiced-voiceless distinction

    Language and Speech

    (1969)
  • P.B. Denes

    Effect of duration on the perception of voicing

    J. Acoust. Soc. Am.

    (1955)
  • R.A. Cole et al.

    Perception of voicing in English affricates and fricatives

    J. Acoust. Soc. Am.

    (1975)
  • D.W. Massaro et al.

    The contribution of fundamental frequency and voice onset time to the /zi/-/si/ distinction

    J. Acoust. Soc. Am.

    (1976)
  • S.D. Soli

    Structure and duration of vowels together specify fricative voicing

    J. Acoust. Soc. Am.

    (1982)
There are more references available in the full text version of this article.

Cited by (0)

View full text