Skip to content
Licensed Unlicensed Requires Authentication Published by De Gruyter Oldenbourg May 25, 2012

Source-Path-Goal: Investigating the Cross-Linguistic Potential of Frame-Semantic Text Analysis

Source-Path-Goal: Das multilinguale Potenzial framesemantischer Textanalyse
  • Oliver Čulo and Gerard de Melo

Abstract

The ability to analyse natural language semantically has been a long-standing goal in information technology. In the last few decades, the increased availability of annotated text collections and new statistical methods have led to great advances in this area. Frame-semantic annotation, as exemplified by the FrameNet project, describes the meaning of a sentence in terms of the involved cognitive scenarios and the roles of individual participants (e. g. the buyer and the seller in a commerce scenario, but also abstract entities like source, path, and goal in a travel scenario). This contribution studies the cross-linguistic potential of FrameNet from multiple perspectives. It investigates a statistical method to determine frame-semantic relatedness of individual words across languages. It also shows how commonalities and differences between languages in expressing states of affairs can be analysed and extracted from annotated parallel corpora.

Zusammenfassung

Die Bedeutung sprachlicher Äußerungen analysieren zu können ist schon lange ein großes Ziel der Informationstechnologie. Die zunehmende Verfügbarkeit annotierter Textsammlungen sowie neueste statistische Methoden haben die Wissenschaft diesem Ziel in den letzten Jahrzehnten ein ganzes Stück näher gebracht. Framesemantische Annotation, wie sie im FrameNet-Projekt angewandt wird, beschreibt die Bedeutung eines Satzes mit der damit verbundenen kognitiven Szene sowie den darin vorkommenden Rollen (z. B. der Käufer und der Verkäufer im Handelsszenario, aber auch abstrakte Einheiten wie Source-Path-Goal im Reiseszenario). In diesem Beitrag wird das mehrsprachige Potenzial von FrameNet diskutiert. Es wird eine statistische Methode vorgestellt, mit deren Hilfe die frame-semantische Ähnlichkeit zwischen Wörtern verschiedener Sprachen berechnet werden kann. Außerdem wird gezeigt, inwiefern sich Sprachen im Ausdruck von Zuständen und Ereignissen unterscheiden und wie diese unterschiedlichen Ausdrucksweisen aus parallelen Korpora extrahiert werden können.


* Correspondence address: International Computer Science Institute, 1947 Center St., 94704 Berkeley, U.S.A.,

Published Online: 2012-5-25
Published in Print: 2012-5-1

© by Oldenbourg Wissenschaftsverlag, Berkeley, Germany

Downloaded on 25.4.2024 from https://www.degruyter.com/document/doi/10.1524/itit.2012.0675/html
Scroll to top button