ContributionAn estimation of the production process for fricative consonants
References (6)
- K. Shirai
Modeling of the generation process of the fricative consonant
Trans. IECE Japan
(1975) - J.H. Heinz
Model studies of the production of fricative consonants
Mas. Inst. Tech. R.L.E. Quart. Progr. Rep.
(1958) - J.H. Heinz
On the properties of voiceless fricative consonants
J. Acoust. Soc. Am.
(1961)
Cited by (3)
Linguistic units and units of speech production
1987, Speech CommunicationLinks are needed to bridge the gap between the analysis of speech as a set of discrete, ordered but durationless linguistic unit and analyses of the continuously changing acoustic signals, defined along a time axis. Current recognition and synthesis devices do not make good use of the structure imposed by speech production processes on the mapping between an allophone sequence and the many possible associated speech signals. A quantitative, flexible articulatory time framework has been developed as a contribution to the new kinds of phonetic descriptions needed. Units of articulation for allophones of the phonemes of British English and methods for linking adjacent allophones are proposed. Tentative specifications for a sub-set are offered, based on a review of published findings for natural speech.
Articulatory schemes are taken to be organised with reference to particular events E. Pairs of events need to be appropriately coordinated in time. The two events may relate to inter-articulator coordination between two different quasi-independent articulators or to the durational extent of a statically maintained state for a single articulator. The coordination between the two events is expressed through the duration D of the time interval between them. Six examples are given of the construction of a complete articulatory time plan for an English sequence. This forms the first stage for a computer-implemented model of the articulatory, aerodynamic and acoustic processes of speech production. The synthetic speech output from the model is given acoustic variations intended to mimic those arising in natural speech due to a speaker's choice of options, including a change in rate of speech. This is achieved in the modelling by altering one or more D values in the articulatory time plan and by dispensing with some optional actions. The variability of multiple repetitions by a real speaker can be introduced into the synthetic speech by perturbing the D values. The model needs to be matched to specific real speakers in order to assess the extent to which it is realistic in its simulation of the variation and variability of acoustic pattern features for natural speech and the extent to which covariations can be predicted with it.
Bis heute fehlt ein verbindendes Glied zwischen der Beschreibung der Sprache als endlicher Satz diskreter, geordneter, in ihrer zeitlichen Ausdehnung aber nicht definierter linguistischer Einheiten und den Segmenten des sich kontinuierlich verändernden akustischen Signals, welches entlang der Zeitacbse definiert wird. Verfahren zur Spracherkennung und -synthese mutzen nur unvollkommen die durch die Sprachproduktionsprozesse vorgegebene Struktur für die Verbindung einer. Alophonseque mit den sprachlichen Signalen, die ihnen zugeordnet werden können. Für die erforderliche neue Art phonetischer Bescureibungen wurde ein quantitatives und flexibles artikulatorisches Zeitmodell entwickelt. Artikulationseinheiten für Allophone der Phoneme des Britischen Englisch und Methoden zur Aneinanderreihung benachbarter Allophone werden vorgeschlagen. Auf der Grundlage von in der Fachliteratur referierten Erkenntnisser aus der natürlichen Sprache wird eine erste nähere Spezifizierung versucht.
Es wird davon ausgegangen, dass sich Artikulationsmuster in Abhängigkeit von bestimmten Ereignissen (E) definieren lassen. Ereignispaare erfordern eine angemessenc zeitliche Koordination. Zwei Ereignisse können in Bezug stehen zur wechselseitigen Koordination zwischen zwei quasi-anabhängigen Artikulatoren oder zur spezifischen Dauer eines statisch gehaltenen Zustandes eines einzelnen Artikulators. Die Koordination zwischen den beiden Ereignissen wird durch die Dauer (D) des Zeitintervalls zwischen ihnen ausgedrückt. Sechs Beispiele für die Konstruktion eines vollständigen artikulatorischen Zeitplanes einer Lautfolge des Englischen werden vorgeführt. Sie stellen das erste Stadium eines auf Rechner implementierten Modells der artikulatorischen, aerodynamischen und akustischen Prozesse der Sprachproduktion dar. Mit der Syntheseausgabe des Modells können akustische Variationen zur Nachahmung bestimmter Sprechweisen in der natürlichen Sprache (z.B. unterschiddliche Sprechgeschwindigkeiten) erzeugt werden. Dies wird durch Veränderung eines oder mehrerer D-Werte im artikulatorischen Zeitplan und das Auslassen einiger optionaler Prozeduren erreicht. Die sich in den Wiederholungen realer Sprecher zeigende Variabilität kann durch Störung der D-Werte nachvollzogen werden. Das Modell muss nun auf die spezifische Sprechweise realer Sprecher abgestellt werden, damit seine Leistung bei der Simulierung von Variation und Variabilität der akustischen Merkmale und der Vorhersage von Kovariationen exakt ermittelt werden kann.
Des liens sont nécessaires pour surmonter le fossé entre l 'analyse de la parole en tant qu'ensemble d'unités linguistiques discrétes, ordonnées mais atemporelles et les analyses de signaux acoustiques continúment variables dans le temps. Les dispositifs actuels de reconnaissance et de synthése usent mal de la structure imposée par les processus de production de la parole lors de l'application d'une séquence allophonique sur la pluralité des signaux de parole y associés. Nous avons développé en tant qu'aide à la description phonétique un cadre de réference articulatoire à la fois quantitatif et souple. Nous proposons des unités articulatoires pour quelques allophones de phonèmes anglais ainsi que des méthodes de liaison avec des allophones adjacents. Des spécifications préliminaires pour un sous-ensemble d'allophones sont proposèes qui sont basées sur des résultats déjà publiés.
Les schèmes articulatoires sont organisés par rapport à des événements saillants E. Il s'agit alors de coordonner dans le temps des couples d'évenements. Ces derniers peuvent concerner la coordination inter-articulateurs entre deux articulateurs différents et quasi autonomes ou concerner un seul articulateur maintenu dans un ètat statique. La coordination entre deux événements est exprimée à travers la durée D de l'intervalle temporel qui les sépare. Nous donnons six exemples de construction d'un plan articulatoire complet pour une séquence d'anglais. Ce plan forme le premier module d'un modèle numérique des processus articulatoires, aérodynamiques et acoustiques de la production de la parole. Le signal ainsi synthétisé est acoustiquement modifié afin de simuler les variations observables en parole naturelle et dues aux options des locuteurs, y compris les modifications du débit d'élocution. Ceci est obtenu en altérant une ou plusieurs valeurs D dans le plan temporel et en négligeant quelques actions optionnelles. La variabilité observée lors de multiples répétitions par un locuteur réel peut être simulée en perturbant les valeurs D. Le modéle réclame d'être confronté à des locuteurs réels afin d'évaluer le réalisme de sa simulation de la variation et de la variabilité des traits acoustiques parole naturelle ainsi que son degré de prédictabilité des covariations.
Estimation of place of articulation of fricatives from spectral features
2023, International Journal of Speech TechnologyEstimation of place of articulation of fricatives from spectral characteristics for speech training
2017, Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH