ŠMERK, Pavel. Fast Morphological Analysis of Czech. In Proceedings of the Raslan Workshop 2009. Brno: Masarykova univerzita, 2009, 4 s. ISBN 978-80-210-5048-8.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Fast Morphological Analysis of Czech
Název česky Rychlá morfologická analýza češtiny
Autoři ŠMERK, Pavel (203 Česká republika, garant, domácí).
Vydání Brno, Proceedings of the Raslan Workshop 2009, 4 s. 2009.
Nakladatel Masarykova univerzita
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW URL
Kód RIV RIV/00216224:14330/09:00029786
Organizační jednotka Fakulta informatiky
ISBN 978-80-210-5048-8
Klíčová slova anglicky morphological analysis; finite state automata
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 21. 5. 2021 23:09.
Anotace
Paper presents a new Czech morphological analyser which takes an advantage of Jan Daciuk's algorithms for minimal deterministic acyclic finite state automata. The new analyser is six times faster than the current analyser ajka concerning the proper analysis, i.e. returning possible lemmata and tags for a given word form, but for some other related tasks is the difference even bigger.
Anotace česky
Článek představuje nový morfologický analyzátor češtiny, který pro reprezentaci slovníků využívá minimálních deterministických acyklických konečných automatů. Nový alayzátor je šestkrát rychlejší než stávající řešení při určování lemmat a značek pro slovní tvary, pro jiné úlohy je rozdíl v rychlosti ještě větší.
Návaznosti
GA407/07/0679, projekt VaVNázev: Právní e-slovník - PES
Investor: Grantová agentura ČR, Právní e-slovník - PES
LC536, projekt VaVNázev: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaVNázev: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce
VytisknoutZobrazeno: 19. 9. 2024 09:45