RYCHLÝ, Pavel. CzAccent - Simple Tool for Restoring Accents in Czech Texts. In Aleš Horák, Pavel Rychlý. 6th Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2012, s. 15-22. ISBN 978-80-263-0313-8.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název CzAccent - Simple Tool for Restoring Accents in Czech Texts
Autoři RYCHLÝ, Pavel (203 Česká republika, garant, domácí).
Vydání Brno, 6th Workshop on Recent Advances in Slavonic Natural Language Processing, od s. 15-22, 8 s. 2012.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 60200 6.2 Languages and Literature
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW URL
Kód RIV RIV/00216224:14330/12:00068067
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-0313-8
Klíčová slova anglicky accents; natural language; czech text; software tool
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: doc. Mgr. Pavel Rychlý, Ph.D., učo 3692. Změněno: 7. 6. 2021 17:21.
Anotace
There are many Czech text written without any accents. The paper describes a tool for fully automatic restoration of Czech accents. The system is based on a simple approach of big lexicon. The resulting accuracy of the system evaluated on large Czech corpora is quite high. The system is in regular use by hundreds of users from around the whole world.
Návaznosti
LM2010013, projekt VaVNázev: LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
7E10057, projekt VaVNázev: Pattern REcognition-based Statistically Enhanced MT (Akronym: PRESEMT)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Pattern REcognition-based Statistically Enhanced MT
VytisknoutZobrazeno: 21. 9. 2024 03:36