OSOLSOBĚ, Klára. Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů. Online. Linguistica Brunensia. Brno: Masarykova Univerzita, 2007, A 55, č. 1, s. 201-218. ISSN 0231-7567. [citováno 2024-04-23]
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů
Název česky Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů
Název anglicky Tagging of Verb Forms in Czech (Slovak) Corpora
Autoři OSOLSOBĚ, Klára (203 Česká republika, garant)
Vydání Linguistica Brunensia, Brno, Masarykova Univerzita, 2007, 0231-7567.
Další údaje
Originální jazyk čeština
Typ výsledku Článek v odborném periodiku
Obor 60200 6.2 Languages and Literature
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Kód RIV RIV/00216224:14210/07:00020581
Organizační jednotka Filozofická fakulta
Klíčová slova anglicky tagging; corpus; verb forms;
Štítky corpus, tagging, verb forms
Příznaky Recenzováno
Změnil Změnila: doc. PhDr. Klára Osolsobě, Dr., učo 1996. Změněno: 12. 11. 2007 12:22.
Anotace
Článek se zabývá problematikou morfologických anotací jednoduchých slovesných tvarů v jazykových korpusech. Srovnává tagsety použité pro značkování slovesných tvarů v českých korpusech (SYN2000/SYN2005, DESAM, KSK) a návrh tagsetu pro značkování SNK.
Anotace anglicky
The confrontation of two tagsets used for tagging of Czech corpora (SYN2000/SYN2005 and DESAM, KSK i.e. the corpus of private correspondence) and a tagset proposal for SNK (i. e. Slovak National Corpus) does not show substantial differences. Nevertheless individual cases differ in 1) lemmatisation and tagging of conditional verb forms (conditional particle) by, 2) tagging of free morpheme "s" (for 2. person singular i.e. ses, sis, žes, tys,...), 3) tagging of grammatical category of tense and voice and 4) lemmatisation and tagging of synthetic future forms. The comparison of the different solutions and the analysis of mistakes can be the first step to upgraded and reciprocally convertible tagsets.
Návaznosti
GA405/98/0746, projekt VaVNázev: Čeština v jazykovědných pojmech(Slovník)
Investor: Grantová agentura ČR, Čeština v jazykovědných pojmech(Slovník)
VytisknoutZobrazeno: 23. 4. 2024 18:15