MRÁKOVÁ, Eva, Lubomír POPELÍNSKÝ and Jan BLAŤÁK. Víceslovné výrazy a klasifikace českých textů (Multiword expressions and Czech document classification). In Znalosti 2004, sborník posterů. 1st ed. Ostrava: VŠB--Technická univerzita Ostrava, 2004, p. 53-56.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Víceslovné výrazy a klasifikace českých textů
Name (in English) Multiword expressions and Czech document classification
Authors MRÁKOVÁ, Eva (203 Czech Republic, guarantor), Lubomír POPELÍNSKÝ (203 Czech Republic) and Jan BLAŤÁK (203 Czech Republic).
Edition 1. vyd. Ostrava, Znalosti 2004, sborník posterů, p. 53-56, 4 pp. 2004.
Publisher VŠB--Technická univerzita Ostrava
Other information
Original language Czech
Type of outcome Proceedings paper
Field of Study 10201 Computer sciences, information science, bioinformatics
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
RIV identification code RIV/00216224:14330/04:00010075
Organization unit Faculty of Informatics
Keywords in English text classification; machine learning; multword expressions
Tags machine learning, multword expressions, text classification
Changed by Changed by: RNDr. Jan Blaťák, Ph.D., učo 2978. Changed: 24/5/2004 22:52.
Abstract
Presentujeme první výsledky experimentů týkající se použití víceslovných výrazů pro klasifikaci českých textů. Podáváme přehled nejdelších, nejčastěji použitých a nejužitečnějších víceslovných skupin. Všímáme si též vlivu lematizace na přesnost klasifikace textů.
Abstract (in English)
The use of chunks - noun, verb and prepositional phrases - as new features in Czech text classification is discussed, and the most interesting as well as the most useful chunks found are introduced. We also mention the role of lemmatization in Czech text classification.
Links
MSM 143300003, plan (intention)Name: Interakce člověka s počítačem, dialogové systémy a asistivní technologie
Investor: Ministry of Education, Youth and Sports of the CR, Human-computer interaction, dialog systems and assistive technologies
PrintDisplayed: 18/9/2024 20:42