Abstract
This paper describes a morphological analyser for Polish. Its features include a large dictionary, a carefully designed tagset, presentation of results as a DAG of interpretations, high efficiency, and free availability for non-commercial use and scientific research.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Similar content being viewed by others
References
1. Janusz Stanisław Bieñ. Koncepcja słownikowej informacji morfologicznej i jej komputerowej wery.kacji. Rozprawy Uniwersytetu Warszawskiego. Wydawnictwa Uniwersytetu Warszawskiego, 1991.
2. Jan Daciuk, Stoyan Mihov, Bruce Watson, and Richard Watson. Incremental construction of minimal acyclic .nite state automata. Computational Linguistics, 26(1):3–16, April 2000.
3. Łukasz Dębowski. Trigram morphosyntactic tagger for Polish. In Mieczysław A. Kłopotek, Sławomir T. Wierzchoń, and Krzysztof Trojanowski, editors, Intelligent Information Processing and Web Mining. Proceedings of the International IIS:IIPWM'04 Conference held in Zakopane, Poland, May 17–20, 2004, pages 409–413. Springer, 2004.
4. Witold Doroszewski, editor. Słownik języka polskiego PAN. Wiedza Powszechna - PWN, 1958–1969.
5. Elść. Przegląd analizatorów morfologicznych dla języka polskiego. Prace IPI PAN 937, Instytut Podstaw Informatyki Polskiej Akademii Nauk, 2001.
6. Tomasz Obrębski. Automatyczna analiza składniowa języka polskiego z wykorzystaniem gramatyki zależnościowej. PhD thesis, Instytut Podstaw Informatyki PAN, Warszawa, April 2002.
7. Maciej Piasecki and Grzegorz Godlewski. Reductionistic, tree and rule based tagger for Polish. In this volume, 2006.
8. Jakub Piskorski, Peter Homola, Małgorzata Marciniak, Agnieszka Mykowiecka, Adam Przepiórkowski, and Marcin Woliñski. Information extraction for Polish using the SProUT platform. In Mieczysław Kłopotek, sławomirWierzchoñ, and Krzysztof Trojanowski, editors, Intelligent Information Processing and Web Mining, Advances in Soft Computing, pages 227–236. Springer, 2004.
9. Adam Przepiórkowski. Składniowe uwarunkowania znakowania morfosyntaktycznego w korpusie IPI PAN. Polonica, XXII–XXIII:57–76, 2003.
10. Adam Przepiórkowski and Marcin Woliñski. A .exemic tagset for Polish. In Proceedings of the Workshop on Morphological Processing of Slavic Languages, EACL 2003, pages 33–40, 2003.
11. Adam Przepiórkowski and Marcin Woliñski. A morphosyntactic tagset for Polish. In Peter Kosta, Joanna Błaszczak, Jens Frasek, Ljudmila Geist, and Marzena Żygis, editors, Investigations into Formal Slavic Linguistics (Contributions of the Fourth European Conference on Formal Description on Slavic Languages), pages 349–362, 2003.
12. Adam Przepiórkowski and Marcin Woliñski. The unbearable lightness of tagging: A case study in morphosyntactic tagging of Polish. In Proceedings of the 4th International Workshop on Linguistically Interpreted Corpora (LINC-03), EACL 2003, pages 109–116, 2003.
13. Zygmunt Saloni. Czasownik polski. Odmiana, słownik. Wiedza Powszechna, Warszawa, 2001.
14. Zygmunt Saloni and Marcin Woliñski. A computerized description of Polish conjugation. In Peter Kosta, Joanna Błaszczak, Jens Frasek, Ljudmila Geist, and Marzena Żygis, editors, Investigations into Formal Slavic Linguistics (Contributions of the Fourth European Conference on Formal Description on Slavic Languages), pages 373–384, 2003.
15. Krzysztof Szafran. Analizator morfologiczny SAM-95: opis uźytkowy. TR 96–05 (226), Instytut Informatyki Uniwersytetu Warszawskiego, Warszawa, 1996.
16. Jan Tokarski. Fleksja polska, jej opis w œwietle mechanizacji w urzłdzeniu przekładowym. Poradnik Językowy, 1961: z. 3 s. 97–112, z. 8 s. 343–353; 1962: z. 4 s. 145–158; 1963: z. 1 s. 2–21, z. 2 s. 55–77, z. 5/6 s. 173–184, z. 9 s. 360–378; 1964: z. 4 s. 135–152, z. 5 s. 185–196, z. 6 s. 241–261.
17. Jan Tokarski. Czasowniki polskie. Formy, typy, wyjłtki. słownik. Warszawa, 1951.
18. Jan Tokarski. Dialog: człowiek - maszyna cyfrowa. Prace Filologiczne, XXIII:183–185, 1972.
19. Jan Tokarski. Schematyczny indeks a tergo polskich form wyrazowych, red. Zygmunt Saloni. Wydawnictwo Naukowe PWN, Warszawa, second edition, 2002.
20. Marcin Woliñski. System znaczników morfosyntaktycznych w korpusie IPI PAN. Polonica, XXII–XXIII:39–55, 2003.
21. Marcin Woliñski. Komputerowa wery.kacja gramatyki œwidziñskiego. PhD thesis, Instytut Podstaw Informatyki PAN, Warszawa, December 2004.
22. Marcin Woliñski. An efficient implementation of a large grammar of Polish. In Zygmunt Vetulani, editor, Human Language Technologies as a Challenge for Computer Science and Linguistics. 2nd Language & Technology Conference April 21–23, 2005, pages 343–347, Poznañ, 2005.
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 2006 Springer
About this paper
Cite this paper
Woliński, M. (2006). Morfeusz — a Practical Tool for the Morphological Analysis of Polish. In: Kłopotek, M.A., Wierzchoń, S.T., Trojanowski, K. (eds) Intelligent Information Processing and Web Mining. Advances in Soft Computing, vol 35. Springer, Berlin, Heidelberg. https://doi.org/10.1007/3-540-33521-8_55
Download citation
DOI: https://doi.org/10.1007/3-540-33521-8_55
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-33520-7
Online ISBN: 978-3-540-33521-4
eBook Packages: EngineeringEngineering (R0)