ŠMERK, Pavel and Pavel RYCHLÝ. Majka – rychlý morfologický analyzátor (Majka - fast morphological analyzer). 2009.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Majka – rychlý morfologický analyzátor
Name (in English) Majka - fast morphological analyzer
Authors ŠMERK, Pavel (203 Czech Republic, guarantor, belonging to the institution) and Pavel RYCHLÝ (203 Czech Republic, belonging to the institution).
Edition 2009.
Other information
Original language Czech
Type of outcome Pilot plant, certified technology, variety, breed
Field of Study 60200 6.2 Languages and Literature
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
WWW URL
RIV identification code RIV/00216224:14330/09:00047873
Organization unit Faculty of Informatics
Keywords (in Czech) morfologie; gramatické značky; lemmatizace; značkování
Keywords in English morphology; annotation; Czech; lemmatization; grammatical tags
Technical parameters rychlý morfologický analyzátor, smlouva se Seznam.cz (IČ 26168685) ze dne 30.11.2009
Changed by Changed by: RNDr. Pavel Šmerk, Ph.D., učo 3880. Changed: 5/5/2011 23:36.
Abstract
Majka je rychlý morfologický analyzátor ve formě knihovny a řádkového programu. Systém Majka navazuje na předchozí systém pro morfologickou analýzu Ajka, se kterým dává zhruba stejné výsledky. Majka je ale zcela nová implementace kompletně založená na konečných automatech, proto je také mnohonásobně rychlejší a flexibilnější. V základní podobě systém k zadanému slovnímu tvaru přiřadí: základní tvar a gramatickou značku, všechna slova patřící ke stejnému lemmatu, všechna možná slova s diakritikou.
Abstract (in English)
Majka is a fast tool which assigns a lemma (basic form) and all possible grammatical tags to each word form on the input. It can be used also for word forms generation or diacritics restoration. Majka is available in the form of a command line tool for batch processing of text files or as a library in the form of calling functions in the C language. Although Majka builds on the previous system for morphological analysis Ajka, which gives roughly the same results, it is an entirely new and independent implementation completely based on finite automata and it is also much faster and more flexible than the previous system.
Links
LC536, research and development projectName: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
2C06009, research and development projectName: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing)
Investor: Ministry of Education, Youth and Sports of the CR
PrintDisplayed: 4/5/2024 13:52