D 2008

Towards Czech Morphological Guesser

ŠMERK, Pavel

Základní údaje

Originální název

Towards Czech Morphological Guesser

Název česky

Český morfologický guesser

Vydání

Brno, Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2008, od s. 1-4, 4 s. 2008

Nakladatel

Masarykova univerzita

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14330/08:00027115

Organizační jednotka

Fakulta informatiky

ISBN

978-80-210-4741-9

UT WoS

000302212600001

Klíčová slova anglicky

morphological guesser; morphological analysis; morphological guessing
Změněno: 7. 1. 2019 14:04, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Paper presents a morphological guesser for Czech based on data from Czech morphological analyzer ajka. The idea behind the presented concept lies in a presumption that the new (and therefore unknown to the analyzer) words in a language behave quite regularly and that a description of this regular behaviour can be extracted from the existing data of the morphological analyzer. The paper describes both the construction of guesser data and the architecture of the guesser itself.

Česky

Článek prezentuje morfologický guesser pro češtinu, který je založený na datech českého morfologického analyzátoru ajka. Konstrukce je založena na předpokladu, že nová (a tedy analyzátoru neznámá) slova se v jazyce chovají pravidelně, a že navíc tato pravidelnost může být extrahována z existujících dat. Článek popisuje jak tvorbu dat, tak fungování samotného guesseru.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce