Z 2008

Morphological Analyzer Ajka

RYCHLÝ, Pavel, Pavel ŠMERK, Karel PALA and Radek SEDLÁČEK

Basic information

Original name

Morphological Analyzer Ajka

Name in Czech

Morfologický analyzátor Ajka

Authors

RYCHLÝ, Pavel (203 Czech Republic, guarantor, belonging to the institution), Pavel ŠMERK (203 Czech Republic, belonging to the institution), Karel PALA (203 Czech Republic, belonging to the institution) and Radek SEDLÁČEK (203 Czech Republic, belonging to the institution)

Edition

2008

Other information

Language

English

Type of outcome

Poloprovoz, ověřená technologie, odrůda, plemeno

Field of Study

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

References:

RIV identification code

RIV/00216224:14330/08:00027989

Organization unit

Faculty of Informatics

Keywords (in Czech)

morfologie; gramatické značky; lemmatizace; značkování

Keywords in English

morphology; annotation; Czech; lemmatization; grammatical tags

Technical parameters

C-library and a command line tool for morphological analysis of Czech, including Czech data files
Změněno: 27/4/2011 15:30, RNDr. Pavel Šmerk, Ph.D.

Abstract

V originále

Ajka is a tool which assigns a lemma (basic form) and all possible grammatical tags to each word form on the input. The command line tool Ajka can be used for batch processing of text files or in interactive mode. The library Alib has the same features but in the form of calling functions in the C language. Both Ajka and Alib need data files MRF and STM with a description of each word.

In Czech

Morfologický analyzátor Ajka je nástroj, který k zadanému slovu přiřadí jeho základní tvar, gramatickou značku a u vybraných slov poznámky o užití slova. Poznámky též mohou obsahovat informace popisující slovotvorné relace. Program Ajka zpracovává vstupní soubor v dávkovém režimu, nebo může být použit interaktivně. Knihovna Alib je knihovna v jazyce C, která poskytuje stejné informace jako program Ajka, ale ve formě volání funkcí. Ajka i Alib potřebují ke svojí práci datové soubory MRF a STM s popisem jednotlivých slov.

Links

LC536, research and development project
Name: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
2C06009, research and development project
Name: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing)
Investor: Ministry of Education, Youth and Sports of the CR