Skip to main content

Morfeusz — a Practical Tool for the Morphological Analysis of Polish

  • Conference paper
Intelligent Information Processing and Web Mining

Part of the book series: Advances in Soft Computing ((AINSC,volume 35))

Abstract

This paper describes a morphological analyser for Polish. Its features include a large dictionary, a carefully designed tagset, presentation of results as a DAG of interpretations, high efficiency, and free availability for non-commercial use and scientific research.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 259.00
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 329.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

References

  1. 1. Janusz Stanisław Bieñ. Koncepcja słownikowej informacji morfologicznej i jej komputerowej wery.kacji. Rozprawy Uniwersytetu Warszawskiego. Wydawnictwa Uniwersytetu Warszawskiego, 1991.

    Google Scholar 

  2. 2. Jan Daciuk, Stoyan Mihov, Bruce Watson, and Richard Watson. Incremental construction of minimal acyclic .nite state automata. Computational Linguistics, 26(1):3–16, April 2000.

    Article  MathSciNet  Google Scholar 

  3. 3. Łukasz Dębowski. Trigram morphosyntactic tagger for Polish. In Mieczysław A. Kłopotek, Sławomir T. Wierzchoń, and Krzysztof Trojanowski, editors, Intelligent Information Processing and Web Mining. Proceedings of the International IIS:IIPWM'04 Conference held in Zakopane, Poland, May 17–20, 2004, pages 409–413. Springer, 2004.

    Google Scholar 

  4. 4. Witold Doroszewski, editor. Słownik języka polskiego PAN. Wiedza Powszechna - PWN, 1958–1969.

    Google Scholar 

  5. 5. Elść. Przegląd analizatorów morfologicznych dla języka polskiego. Prace IPI PAN 937, Instytut Podstaw Informatyki Polskiej Akademii Nauk, 2001.

    Google Scholar 

  6. 6. Tomasz Obrębski. Automatyczna analiza składniowa języka polskiego z wykorzystaniem gramatyki zależnościowej. PhD thesis, Instytut Podstaw Informatyki PAN, Warszawa, April 2002.

    Google Scholar 

  7. 7. Maciej Piasecki and Grzegorz Godlewski. Reductionistic, tree and rule based tagger for Polish. In this volume, 2006.

    Google Scholar 

  8. 8. Jakub Piskorski, Peter Homola, Małgorzata Marciniak, Agnieszka Mykowiecka, Adam Przepiórkowski, and Marcin Woliñski. Information extraction for Polish using the SProUT platform. In Mieczysław Kłopotek, sławomirWierzchoñ, and Krzysztof Trojanowski, editors, Intelligent Information Processing and Web Mining, Advances in Soft Computing, pages 227–236. Springer, 2004.

    Google Scholar 

  9. 9. Adam Przepiórkowski. Składniowe uwarunkowania znakowania morfosyntaktycznego w korpusie IPI PAN. Polonica, XXII–XXIII:57–76, 2003.

    Google Scholar 

  10. 10. Adam Przepiórkowski and Marcin Woliñski. A .exemic tagset for Polish. In Proceedings of the Workshop on Morphological Processing of Slavic Languages, EACL 2003, pages 33–40, 2003.

    Google Scholar 

  11. 11. Adam Przepiórkowski and Marcin Woliñski. A morphosyntactic tagset for Polish. In Peter Kosta, Joanna Błaszczak, Jens Frasek, Ljudmila Geist, and Marzena Żygis, editors, Investigations into Formal Slavic Linguistics (Contributions of the Fourth European Conference on Formal Description on Slavic Languages), pages 349–362, 2003.

    Google Scholar 

  12. 12. Adam Przepiórkowski and Marcin Woliñski. The unbearable lightness of tagging: A case study in morphosyntactic tagging of Polish. In Proceedings of the 4th International Workshop on Linguistically Interpreted Corpora (LINC-03), EACL 2003, pages 109–116, 2003.

    Google Scholar 

  13. 13. Zygmunt Saloni. Czasownik polski. Odmiana, słownik. Wiedza Powszechna, Warszawa, 2001.

    Google Scholar 

  14. 14. Zygmunt Saloni and Marcin Woliñski. A computerized description of Polish conjugation. In Peter Kosta, Joanna Błaszczak, Jens Frasek, Ljudmila Geist, and Marzena Żygis, editors, Investigations into Formal Slavic Linguistics (Contributions of the Fourth European Conference on Formal Description on Slavic Languages), pages 373–384, 2003.

    Google Scholar 

  15. 15. Krzysztof Szafran. Analizator morfologiczny SAM-95: opis uźytkowy. TR 96–05 (226), Instytut Informatyki Uniwersytetu Warszawskiego, Warszawa, 1996.

    Google Scholar 

  16. 16. Jan Tokarski. Fleksja polska, jej opis w œwietle mechanizacji w urzłdzeniu przekładowym. Poradnik Językowy, 1961: z. 3 s. 97–112, z. 8 s. 343–353; 1962: z. 4 s. 145–158; 1963: z. 1 s. 2–21, z. 2 s. 55–77, z. 5/6 s. 173–184, z. 9 s. 360–378; 1964: z. 4 s. 135–152, z. 5 s. 185–196, z. 6 s. 241–261.

    Google Scholar 

  17. 17. Jan Tokarski. Czasowniki polskie. Formy, typy, wyjłtki. słownik. Warszawa, 1951.

    Google Scholar 

  18. 18. Jan Tokarski. Dialog: człowiek - maszyna cyfrowa. Prace Filologiczne, XXIII:183–185, 1972.

    Google Scholar 

  19. 19. Jan Tokarski. Schematyczny indeks a tergo polskich form wyrazowych, red. Zygmunt Saloni. Wydawnictwo Naukowe PWN, Warszawa, second edition, 2002.

    Google Scholar 

  20. 20. Marcin Woliñski. System znaczników morfosyntaktycznych w korpusie IPI PAN. Polonica, XXII–XXIII:39–55, 2003.

    Google Scholar 

  21. 21. Marcin Woliñski. Komputerowa wery.kacja gramatyki œwidziñskiego. PhD thesis, Instytut Podstaw Informatyki PAN, Warszawa, December 2004.

    Google Scholar 

  22. 22. Marcin Woliñski. An efficient implementation of a large grammar of Polish. In Zygmunt Vetulani, editor, Human Language Technologies as a Challenge for Computer Science and Linguistics. 2nd Language & Technology Conference April 21–23, 2005, pages 343–347, Poznañ, 2005.

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 2006 Springer

About this paper

Cite this paper

Woliński, M. (2006). Morfeusz — a Practical Tool for the Morphological Analysis of Polish. In: Kłopotek, M.A., Wierzchoń, S.T., Trojanowski, K. (eds) Intelligent Information Processing and Web Mining. Advances in Soft Computing, vol 35. Springer, Berlin, Heidelberg. https://doi.org/10.1007/3-540-33521-8_55

Download citation

  • DOI: https://doi.org/10.1007/3-540-33521-8_55

  • Publisher Name: Springer, Berlin, Heidelberg

  • Print ISBN: 978-3-540-33520-7

  • Online ISBN: 978-3-540-33521-4

  • eBook Packages: EngineeringEngineering (R0)

Publish with us

Policies and ethics