Skip to main content

Automatische Erzeugung von semantischem Markup in Agenturmeldungen

  • Chapter
SGML und XML
  • 120 Accesses

Zusammenfassung

Neue Medienformen und Verbreitungstechnologien verändern auch das Angebots- und Aufgabenprofil von Nachrichtenanbietern. Die parallele Veröffentlichung einer Nachricht über unterschiedliche Medien oder die Wiedernutzung der einmal recherchierten und zusammengetragenen Information in unterschiedlichen Angebotsformen erfordern entsprechend aufbereitete Nachrichtenformate, aus denen sich der gewünschte Mehrwert ohne menschliches Eingreifen erzeugen läßt. Die Nachrichtenindustrie hat auf diese Herausforderungen u.a. mit der Entwicklung des News Industry Text Format (NITF) reagiert. Das NITF (IPTC-NAA 1998) ist ein SGML/XML-konformer Standard zur formalen (strukturellen) und inhaltsorientierten (semantischen) Auszeichnung von Nachrichtentexten, der unter der Federführung des IPTC (International Press and Telecommunications Council) und der NAA (Newspaper Association of America) und unter Beteiligung namhafter Nachrichtenagenturen und Zeitungen ausgearbeitet worden ist.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 49.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 59.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. Alexa, M.; Rostek, L.: Computer-assisted, corpus-based text analysis with TATOE. In: ALLC-ACH 96, Book of Abstracts (Bergen, Norway). o.O., 1996, S. 11–17

    Google Scholar 

  2. Carnegie Group: Research and Technology: Language, Text and Voice Processing. o.O., 1998. Erhältlich im Internet: http://netral.cgi.com/web2/govt/gov-text.html

    Google Scholar 

  3. Chen, Hsin-Hsi; Lee, J.-L.: Identification and classification of proper nouns in Chinese Texts. In: Proceedings of COLING-96 (Copenhagen, Denmark). Bd. 1. o.O., 1996, S. 222–229

    Google Scholar 

  4. Flanders, J.; Bauman, S.; Caton, P.; Cournane, M.; McCarty, W.; Bradley, J.: Applying the TEI: Problems in the classification of proper nouns. In: Queens University (Veranst.): ACH-ALLC Conference Abstracts (Kingston, Canada, June 3–7, 1997). o. O., 1997, S. 53–58

    Google Scholar 

  5. Hockey, S.; Butler, T.; Brown, S.; Fischer, S.: The Orlando Project: Humanities Computing in Conversation with Literary History In: Queens University (Veranst.): ACH-ALLC Conference Abstracts (Kingston, Canada, June 3–7, 1997). o.O., 1997, S. 83–89

    Google Scholar 

  6. IPTC-NAA (Hrsg): IPTC-NAA News Industry Text Format (NITF). Version 2.0 bl. o.O., 1998. Erhältlich im Internet: http://www.iptc.org/iptc

    Google Scholar 

  7. Jacobs, Paul S.; Rau, Lisa S.: SCISOR: Extracting Information from On-line News. Communications of the ACM 33 (1990) Nr. 11, S. 88–97

    Article  Google Scholar 

  8. Kitani, T.; Mitamura, T.: An accurate morphological analysis and proper noun identification for Japanese text processing. In: Transactions of Information Processing Society of Japan 35 (1994), Nr. 3, S. 404–413

    Google Scholar 

  9. Lingsoft — GERTWOL: German Morphological Analyzer. Helsinki (Finnland), 1996. Erhältlich im Internet: http://www.lingsoft.fi.

    Google Scholar 

  10. Mani, I.; MacMillan, R. T.: Identifying Unknown Proper Names in Newswire Text. In: Boguraev, B.; Pustejovsky, J. (Hrsg.): Corpus Processing for Lexical Acquisition. Cambridge, MA: MIT Press, 1996, S. 41–59

    Google Scholar 

  11. McCarty, W.: Encoding Persons and Places in the Metamorphoses of Ovid. Part 1: Engineering the Text. o.O., 1994 (Texte 13/14), S. 121–172

    Google Scholar 

  12. McCarty, W: Peering Through the Skylight. Part 2: Towards an Electronic Edition of Ovid’s Metamorphoses. o.O., 1995 (Texte 15/16), S. 261–305

    Google Scholar 

  13. McDonald, D.: Internal and External Evidence in the Identification and Semantic Categorization of Proper Names. In: Boguraev, B.; Pustejovsky, J. (Hrsg.): Corpus Processing for Lexical Acquisition. Cambridge, MA: MIT Press, 1996, S. 21–39

    Google Scholar 

  14. Paik, W.; Liddy, E. D.; Yu, E; McKenna, M.: Categorizing and Standardizing Proper Nouns for Efficient Information Retrieval. In: Boguraev, B.; Pustejovsky, J. (Hrsg.): Corpus Processing for Lexical Acquisition. Cambridge (MA): MIT Press, 1996, S. 61–73

    Google Scholar 

  15. Radev, D. R.; McKeown, K.: Building a Generation Knowledge Source using Internet-Accessible Newswire. In: Proceedings of the Fifth Conference on Applied Natural Language Processing, Washington, DC, 1997, S. 221–228

    Google Scholar 

  16. Rostek, L.; Alexa, M.: Marking up in TATOE and exporting to SGML — Rule development for identifying NITF categories. In: Computer and the Humanities 31 (1998), S. 311–326

    Article  Google Scholar 

  17. Rostek, L.; Möhr, W.; Fischer, D.: Weaving a web: The structure and creation of an object network representing an electronic reference work. In: Electronic Publishing 6 (1994), 4, S. 495–505

    Google Scholar 

  18. Wakao, T.; Gaizauskas, R.; Wilks, Y.: Evaluation of an Algorithm for the Recognition and Classification of Proper Nouns. In: Proceedings of COLING-96 (Copenhagen, Denmark). Bd. 1. o.O., 1996, S. 418–423

    Google Scholar 

Download references

Authors

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 1999 Springer-Verlag Berlin Heidelberg

About this chapter

Cite this chapter

Rostek, L. (1999). Automatische Erzeugung von semantischem Markup in Agenturmeldungen. In: Möhr, W., Schmidt, I. (eds) SGML und XML. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-46881-0_16

Download citation

  • DOI: https://doi.org/10.1007/978-3-642-46881-0_16

  • Publisher Name: Springer, Berlin, Heidelberg

  • Print ISBN: 978-3-540-65543-5

  • Online ISBN: 978-3-642-46881-0

  • eBook Packages: Springer Book Archive

Publish with us

Policies and ethics