Z 2008

Morphological Analyzer Ajka

RYCHLÝ, Pavel, Pavel ŠMERK, Karel PALA a Radek SEDLÁČEK

Základní údaje

Originální název

Morphological Analyzer Ajka

Název česky

Morfologický analyzátor Ajka

Autoři

RYCHLÝ, Pavel (203 Česká republika, garant, domácí), Pavel ŠMERK (203 Česká republika, domácí), Karel PALA (203 Česká republika, domácí) a Radek SEDLÁČEK (203 Česká republika, domácí)

Vydání

2008

Další údaje

Jazyk

angličtina

Typ výsledku

Poloprovoz, ověřená technologie, odrůda, plemeno

Obor

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/08:00027989

Organizační jednotka

Fakulta informatiky

Klíčová slova česky

morfologie; gramatické značky; lemmatizace; značkování

Klíčová slova anglicky

morphology; annotation; Czech; lemmatization; grammatical tags

Technické parametry

C-library and a command line tool for morphological analysis of Czech, including Czech data files
Změněno: 27. 4. 2011 15:30, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Ajka is a tool which assigns a lemma (basic form) and all possible grammatical tags to each word form on the input. The command line tool Ajka can be used for batch processing of text files or in interactive mode. The library Alib has the same features but in the form of calling functions in the C language. Both Ajka and Alib need data files MRF and STM with a description of each word.

Česky

Morfologický analyzátor Ajka je nástroj, který k zadanému slovu přiřadí jeho základní tvar, gramatickou značku a u vybraných slov poznámky o užití slova. Poznámky též mohou obsahovat informace popisující slovotvorné relace. Program Ajka zpracovává vstupní soubor v dávkovém režimu, nebo může být použit interaktivně. Knihovna Alib je knihovna v jazyce C, která poskytuje stejné informace jako program Ajka, ale ve formě volání funkcí. Ajka i Alib potřebují ke svojí práci datové soubory MRF a STM s popisem jednotlivých slov.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce