JAKUBÍČEK, Miloš, Vojtěch KOVÁŘ a Pavel ŠMERK. Czech Morphological Tagset Revisited. In Horák, Rychlý. Proceedings of Recent Advances in Slavonic Natural Language Processing 2011. Brno: Tribun EU, 2011, s. 29-42. ISBN 978-80-263-0077-9.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Czech Morphological Tagset Revisited
Název česky Revize morfologické značkové sady pro češtinu
Autoři JAKUBÍČEK, Miloš (203 Česká republika, garant, domácí), Vojtěch KOVÁŘ (203 Česká republika, domácí) a Pavel ŠMERK (203 Česká republika, domácí).
Vydání Brno, Proceedings of Recent Advances in Slavonic Natural Language Processing 2011, od s. 29-42, 14 s. 2011.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 60200 6.2 Languages and Literature
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW URL
Kód RIV RIV/00216224:14330/11:00050171
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-0077-9
Klíčová slova česky morfologie;značka;značková sada;anotace;čeština
Klíčová slova anglicky morphology;tag;tagset;annotation;Czech
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Vojtěch Kovář, Ph.D., učo 139915. Změněno: 26. 5. 2021 21:19.
Anotace
Lot of natural language processing is built on top of some solid morphological annotation. In this paper we present an update of the Czech morphological tagset as given by the analyzer Ajka that has been used for academic as well as commercial purposes for more than dozen years. The revision reacts on rather practical issues that we had to face during development of subsequent tools for NLP, parsers in the first place. We describe the reasoning behind each of the changes and include the full updated tagset reference manual. Finally we provide a comparison and mapping to the Universal tagset as produced by Google.
Anotace česky
Článek popisuje aktualizaci atributivní značkové sady pro morfologii češtiny, implementované v morfologickém analyzátoru Ajka, který je používán pro různé akademické i komerční účely již více než 10 let. Revize reaguje na některé problémy praktického rázu, jimž jsme čelili při vývoji navazujících nástrojů pro zpracování přirozeného jazyka, zejména syntaktických analyzátorů. Popisujeme důvody pro jednotlivé změny a přikládáme plný manuál k aktualizované sadě značek. Článek také obsahuje porovnání a převod na univerzální značkovou sadu vydanou společností Google.
Návaznosti
GAP401/10/0792, projekt VaVNázev: Temporální aspekty znalostí a informací
Investor: Grantová agentura ČR, Temporální aspekty znalostí a informací
GA407/07/0679, projekt VaVNázev: Právní e-slovník - PES
Investor: Grantová agentura ČR, Právní e-slovník - PES
LC536, projekt VaVNázev: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
VytisknoutZobrazeno: 9. 5. 2024 16:35