ŠMERK, Pavel. Tools for Fast Morphological Analysis Based on Finite State Automata. In Eighth Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2014, s. 147-150. ISSN 2336-4289.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Tools for Fast Morphological Analysis Based on Finite State Automata
Autoři ŠMERK, Pavel (203 Česká republika, garant, domácí).
Vydání Brno, Eighth Workshop on Recent Advances in Slavonic Natural Language Processing, od s. 147-150, 4 s. 2014.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW URL
Kód RIV RIV/00216224:14330/14:00077522
Organizační jednotka Fakulta informatiky
ISSN 2336-4289
Klíčová slova anglicky morphological analysis; minimal deterministic finite state automata
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 21. 5. 2021 23:13.
Anotace
The paper presents a new implementation of some of Jan Daciuk’s algorithms and tools for morphological analysis based on finite state automata. In particular, we offer a reimplemented version of the tool which builds the automata from an input set of strings and of the tool which performs the morphological analysis itself. In addition to 8-bit versions we also offer “Unicode-aware” versions with the Unicode characters encoded directly in the arcs of the automaton. The new implementation is faster than the original one and its code is much more simple and straightforward.
Návaznosti
LM2010013, projekt VaVNázev: LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
VytisknoutZobrazeno: 14. 7. 2024 20:05