Elsevier

Speech Communication

Volume 6, Issue 3, September 1987, Pages 203-216
Speech Communication

A graph-oriented implementation of a grapheme-to-phoneme transcriber for Italian

https://doi.org/10.1016/0167-6393(87)90026-4Get rights and content

Abstract

A graph-oriented computational approach to the grapheme-to-phoneme transcription of Italian written texts is described. The letter-to-sound transcription rule system is built up taking into account the implicit phonotactic constraints of the Italian language. The system follows the mathematical model called Finite States Automata (FSA), which is generalized and augmented to obtain a simple syntax-directed translation schema. The whole set of rules described and implemented is often associated with a particular set of exceptions. These rules are entirely based on the pure orthographic form of the words, and no level of grammatical knowledge of their classes is considered. After describing the rules in their traditional notation and formalism, we consider both the graph-oriented point of view relative to the transcriber implementation and some examples of the transcription procedure. Finally, the advantages and disadvantages of the graph-oriented approach will be shown and discussed, together with future trends and improvements.

Zusammenfassung

Beschrieben wird ein Ansatz zur Graphem-Phonem-Konversion des Italienischen. Das Regelsystem für die Graphem-Laut-Transkription, welches auf dem zur Erreichung eines einfachen syntaxabhängigen Übersetzungsschemas generalisierten und erweiterten mathematischen Finite-State-Automata-Modell (FSA) beruht, wird unter Berücksichtigung der impliziten phonotaktischen Beschränkungen des Italienischen aufgebaut. Die im einzelnen beschriebenen und implementieren Regeln, die von der reinen orthographischen Wortform ausgehen und keine Informationen über ihre grammatische Klassenzugehörigkeit erfordern, werden häufig durch Ausnahmeanweisungen spezifiziert. Nach Beschreibung der Regeln in ihrer traditionellen Notation und Systematik betrachten wir der ESA orientierten Standpunkt unter dem Aspekt seiner Implementierungsproblematik und diskutieren einige Beispiele der Transkriptionsprozedur. Schliesslich werden Vorzüge und Nachteile unseres Ansatzes sowie zukünftige Entwicklungen und Verbesserungen besprochen.

Résumé

Nous décrivons une méthode de transcription graphèmes/phonèmes de textes écrits en italien. Notre approche s'appuye sur la théorie mathématique des graphes. Le système de règles est construit au fur et à mesure en tenant compte des constraintes phonotactiques implicites de l'italien. Le système est organisé conformément au modèle mathématique des automates finis, qui a été généralisé et complété afin d'obtenir un schéma simple de traduction syntaxiquement orienté. Une gestion des exceptions compléte l'ensemble des règles implantées. Ces règles font appel à l'orthographe du mot. Aucune information supplémentaire relative à leur appartenance à une classe grammaticale n'est donnée. Nous décrivons d'abord les règles à l'aide de la notation classique, ensuite du point de vue de leur implantation sous forme de graphes. Nous donnons quelques exemples de la procédure de transcription. Enfin, nous discutons les avantages et désavantages d'une approche faisant appel à la théorie mathématique des graphes ainsi que les développements futurs possibles.

References (16)

  • E Farnetani et al.

    Effects of Syllable and Word Structure on Segmental Durations in Spoken Italian

    Speech Comm.

    (1986)
  • A.V Ullman et al.

    The Theory of Parsing, Translation and Compiling

    (1972)
  • J Allen

    Speech Synthesis from Unrestricted Text

  • U Bortolini Ricceri et al.

    Proposte di Descrizione Fonetica

    (1976)
  • R Carlson et al.

    A Text-to-speech System Based Entirely on Rules

  • N Chomsky et al.

    The Sound Pattern of English

    (1968)
  • R Delmonte

    Analisi Automatica delle Strutture Prosodiche

  • R Delmonte et al.

    A Text-to-Speech System for Italian

There are more references available in the full text version of this article.

Cited by (2)

View full text