ŠMERK, Pavel and Pavel RYCHLÝ. Majka – rychlý morfologický analyzátor (Majka - fast morphological analyzer). 2009. |
Other formats:
BibTeX
LaTeX
RIS
|
Basic information | |
---|---|
Original name | Majka – rychlý morfologický analyzátor |
Name (in English) | Majka - fast morphological analyzer |
Authors | ŠMERK, Pavel (203 Czech Republic, guarantor, belonging to the institution) and Pavel RYCHLÝ (203 Czech Republic, belonging to the institution). |
Edition | 2009. |
Other information | |
---|---|
Original language | Czech |
Type of outcome | Pilot plant, certified technology, variety, breed |
Field of Study | 60200 6.2 Languages and Literature |
Country of publisher | Czech Republic |
Confidentiality degree | is not subject to a state or trade secret |
WWW | URL |
RIV identification code | RIV/00216224:14330/09:00047873 |
Organization unit | Faculty of Informatics |
Keywords (in Czech) | morfologie; gramatické značky; lemmatizace; značkování |
Keywords in English | morphology; annotation; Czech; lemmatization; grammatical tags |
Technical parameters | rychlý morfologický analyzátor, smlouva se Seznam.cz (IČ 26168685) ze dne 30.11.2009 |
Changed by | Changed by: RNDr. Pavel Šmerk, Ph.D., učo 3880. Changed: 5/5/2011 23:36. |
Abstract |
---|
Majka je rychlý morfologický analyzátor ve formě knihovny a řádkového programu. Systém Majka navazuje na předchozí systém pro morfologickou analýzu Ajka, se kterým dává zhruba stejné výsledky. Majka je ale zcela nová implementace kompletně založená na konečných automatech, proto je také mnohonásobně rychlejší a flexibilnější. V základní podobě systém k zadanému slovnímu tvaru přiřadí: základní tvar a gramatickou značku, všechna slova patřící ke stejnému lemmatu, všechna možná slova s diakritikou. |
Abstract (in English) |
---|
Majka is a fast tool which assigns a lemma (basic form) and all possible grammatical tags to each word form on the input. It can be used also for word forms generation or diacritics restoration. Majka is available in the form of a command line tool for batch processing of text files or as a library in the form of calling functions in the C language. Although Majka builds on the previous system for morphological analysis Ajka, which gives roughly the same results, it is an entirely new and independent implementation completely based on finite automata and it is also much faster and more flexible than the previous system. |
Links | |
---|---|
LC536, research and development project | Name: Centrum komputační lingvistiky |
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky | |
2C06009, research and development project | Name: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing) |
Investor: Ministry of Education, Youth and Sports of the CR |
PrintDisplayed: 4/5/2024 13:52