Elsevier

Speech Communication

Volume 18, Issue 4, June 1996, Pages 369-379
Speech Communication

Acoustic parameters for place of articulation identification and classification of Spanish unvoiced stops

https://doi.org/10.1016/0167-6393(96)00025-8Get rights and content

Abstract

The analysis of the acoustic parameters which best summarize the cues to phone discrimination for the language under consideration should be a previous step in acoustic-phonetic decoding, regardless of the methodology to be used. The Spanish language has not been widely analyzed from this point of view. This work deals with the acoustic discrimination of Spanish stop consonants. Our main goal was to find a reliable and reduced set of parameters for place of articulation identification of Spanish unvoiced stops. On the basis of the obtained parameters, two automatic classifiers were developed and tested. Only the acoustic features of the burst segment, automatically segmented from the speech waveform, were considered in the parameter estimation. The analysis of these features was carried out in both the time and frequency domains over a CV context corpus uttered by 6 speakers. In the first case, the classifier was designed as a procedural form. Alternatively, in the second case a statistical classifier was obtained from a previous automatic discriminant analysis of the parameters. Both classifiers were tested over a CV context corpus uttered by 40 new speakers not included in the analysis corpus, which resulted in a good rate of identification.

Zusammenfassung

Die Analyse der akustischen Parameter, die Phonemen einer Sprache unterscheiden, ist ein vorhergehender Schritt um die akustische-phonetische Dekodifizierung zu verstehen, mit Unabhängigkeit der Methodologie die man benutzt. Die Spanische Sprache ist aber unter diese Perspektive sehr wenig studiert worden. Diese Arbeit handelt über die Unterscheidung der Spanischen okklusiveren Konsonanten. Unser Ziel war eine kleine Menge von bedeutsamen Parameter für die Identifizierung des Gliederungspunktes der Spanischen tauben Okklusiven zu suchen. Von diesen Parameter ausgehend, hat man zwei automatische Klassifizierungsalgorithmen entwickelt und probiert. Um die Parameter abzuschätzen sind nur die akustischen Kennzeichnungen des explosives Segmentes betrachtet worden. Dieser wurde aus der Form der Stimmenwelle herausgezogen. Die analyse der Charakteristiken wurde mit sechs verschiedenen Sprecher auf einem CV Silbencorpus sowohl im Zeit — wie im Frekuentiellbereich ausgeführt. Im ersten Fall hat man die verschiedenen Kennzeichnungen mit einem Regelsystem sortiert. In zweiten Fall hat man gegenüber ein statistischer Sortierer aus einer vorhergehenden Unterscheidungsanalyse der Parameter entwickelt. Um beide Sortierungen zu probieren ist ein CV Silbencorpus von 40 neue Sprecher ausgesprochen worden und man hat gute Identifizierungsprozentsätze erreicht.

Résumé

L'analyse des paramètres acoustiques pour la caractérisation et l'identification des phonèmes de la langue à étudier représente la première étape du décodage acoustique-phonétique, indépendamment de la méthode utilisée. On trouve malgré tout très peu d'analyses acoustico-phonétiques de la langue espagnole. Le travail présenté ici traite de la discrimination des occlusives espagnoles. Rechercher un ensemble réduit de paramètres robustes pour identifier le lieu d'articulation des occlusives sourdes a constitué notre premier objectif. A partir de cet ensemble de paramètres, on a ensuite élaboré et évalué deux algorithmes de classification et de reconnaissance automatique. Après une étape de localisation automatique de l'explosion (“burst”), seules les caractéristiques acoustiques de ce segment sont prises en compte pour l'estimation des paramètres. On a mesuré aussi bien les caractéristiques temporelles que fréquentielles sur un corpus de syllables CV prononcées par 6 locuteurs. On a conçu, dans le premier cas, un système procédural à base de règles, pour reconnaître le lieu d'articulation. Pour le traitement des paramètres fréquentiels, on a mis au point un classifieur statistique, développé à partir d'une analyse discriminante préalable des paramètres d'entrée. Un corpus de syllables CV prononcées par 40 nouveaux locuteurs, non utilisé pour la définition et l'analyse des paramètres, a permis d'évaluer les deux systèmes qui ont tous deux conduit à de bons résultats d'identification.

References (0)

Cited by (7)

  • Prosodic and accentual information for automatic speech recognition

    2003, IEEE Transactions on Speech and Audio Processing
  • Plosive spotting with margin classifiers

    2001, EUROSPEECH 2001 - SCANDINAVIA - 7th European Conference on Speech Communication and Technology
View all citing articles on Scopus
View full text