Towards Czech Morphological Guesser

ŠMERK, Pavel. Towards Czech Morphological Guesser. In Petr Sojka, Aleš Horák. Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2008. Brno: Masarykova univerzita, 2008, s. 1-4. ISBN 978-80-210-4741-9.

Další formáty: BibTeX LaTeX RIS

Základní údaje
Originální název	Towards Czech Morphological Guesser
Název česky	Český morfologický guesser
Autoři	ŠMERK, Pavel (203 Česká republika, garant, domácí).
Vydání	Brno, Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2008, od s. 1-4, 4 s. 2008.
Nakladatel	Masarykova univerzita

Další údaje
Originální jazyk	angličtina
Typ výsledku	Stať ve sborníku
Obor	10201 Computer sciences, information science, bioinformatics
Stát vydavatele	Česká republika
Utajení	není předmětem státního či obchodního tajemství
Forma vydání	tištěná verze "print"
WWW	URL RASLAN 2008 Workshop web page
Kód RIV	RIV/00216224:14330/08:00027115
Organizační jednotka	Fakulta informatiky
ISBN	978-80-210-4741-9
UT WoS	000302212600001
Klíčová slova anglicky	morphological guesser; morphological analysis; morphological guessing
Štítky	morphological analysis, morphological guesser, morphological guessing
Změnil	Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 7. 1. 2019 14:04.

Anotace

Paper presents a morphological guesser for Czech based on data from Czech morphological analyzer ajka. The idea behind the presented concept lies in a presumption that the new (and therefore unknown to the analyzer) words in a language behave quite regularly and that a description of this regular behaviour can be extracted from the existing data of the morphological analyzer. The paper describes both the construction of guesser data and the architecture of the guesser itself.

Anotace česky

Článek prezentuje morfologický guesser pro češtinu, který je založený na datech českého morfologického analyzátoru ajka. Konstrukce je založena na předpokladu, že nová (a tedy analyzátoru neznámá) slova se v jazyce chovají pravidelně, a že navíc tato pravidelnost může být extrahována z existujících dat. Článek popisuje jak tvorbu dat, tak fungování samotného guesseru.

Návaznosti
LC536, projekt VaV	Název: Centrum komputační lingvistiky
LC536, projekt VaV	Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaV	Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
2C06009, projekt VaV	Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce

VytisknoutZobrazeno: 25. 4. 2024 05:42

Towards Czech Morphological Guesser

Další aplikace