ŠMERK, Pavel. Towards Czech Morphological Guesser. In Petr Sojka, Aleš Horák. Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2008. Brno: Masarykova univerzita, 2008, s. 1-4. ISBN 978-80-210-4741-9.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Towards Czech Morphological Guesser
Název česky Český morfologický guesser
Autoři ŠMERK, Pavel (203 Česká republika, garant, domácí).
Vydání Brno, Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2008, od s. 1-4, 4 s. 2008.
Nakladatel Masarykova univerzita
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW URL RASLAN 2008 Workshop web page
Kód RIV RIV/00216224:14330/08:00027115
Organizační jednotka Fakulta informatiky
ISBN 978-80-210-4741-9
UT WoS 000302212600001
Klíčová slova anglicky morphological guesser; morphological analysis; morphological guessing
Štítky morphological analysis, morphological guesser, morphological guessing
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 7. 1. 2019 14:04.
Anotace
Paper presents a morphological guesser for Czech based on data from Czech morphological analyzer ajka. The idea behind the presented concept lies in a presumption that the new (and therefore unknown to the analyzer) words in a language behave quite regularly and that a description of this regular behaviour can be extracted from the existing data of the morphological analyzer. The paper describes both the construction of guesser data and the architecture of the guesser itself.
Anotace česky
Článek prezentuje morfologický guesser pro češtinu, který je založený na datech českého morfologického analyzátoru ajka. Konstrukce je založena na předpokladu, že nová (a tedy analyzátoru neznámá) slova se v jazyce chovají pravidelně, a že navíc tato pravidelnost může být extrahována z existujících dat. Článek popisuje jak tvorbu dat, tak fungování samotného guesseru.
Návaznosti
LC536, projekt VaVNázev: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaVNázev: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce
VytisknoutZobrazeno: 25. 4. 2024 05:42