ABSTRACT
Automatic text classification is still a challenging in the literature, specially for multi-label classification. In this work we evaluate the performance of the Multi-Label k-Nearest Neighbor algorithm for a multi-labeled dataset with more than 1,000 possible labels to be assigned to each one of the documents in the dataset. The results are promising.
- CNAE. Classificação nacional de atividades econômicas - cnae 1.0 / cnae-fiscal 1.1. Technical report, Instituto Brasileiro de Geografia e Estatística (IBGE), 2003.Google Scholar
- DNRC. Ranking das Juntas Comerciais Segundo Movimento de Constituição, Alteração e Extinção e Cancelamento de Empresas, 2008. Ministério do Desenvolvimento, Indústria e Comércio Exterior - Secretaria do Desenvolvimento da Produção, Departamento Nacional de Registro do Comércio (DNRC).Google Scholar
- E. Oliveira, P. M. Ciarelli, W. F. Henrique, L. Veronese, F. Pedroni, and A. F. D. Souza. Intelligent classification of economic activities from free text desciptions. V Workshop em Tecnologia da Informação e da Linguagem Humana - TIL, 2007.Google Scholar
- F. Sebastiani. Machine Learning in Automated Text Categorization. ACM Computing Surveys, 34(1):1--47, 2002. Google ScholarDigital Library
- M.-L. Zhang and Z.-H. Zhou. ML-KNN: A Lazy Learning Approach to Multi-Label Learning. Pattern Recogn., 40(7):2038--2048, 2007. Google ScholarDigital Library
Index Terms
- Avaliação do desempenho do algoritmo ML-kNN em classificação de textos livres de atividades econômicas
Comments