J 2007

Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů

OSOLSOBĚ, Klára

Základní údaje

Originální název

Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů

Název česky

Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů

Název anglicky

Tagging of Verb Forms in Czech (Slovak) Corpora

Autoři

OSOLSOBĚ, Klára (203 Česká republika, garant)

Vydání

Linguistica Brunensia, Brno, Masarykova Univerzita, 2007, 0231-7567

Další údaje

Jazyk

čeština

Typ výsledku

Článek v odborném periodiku

Obor

60200 6.2 Languages and Literature

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14210/07:00020581

Organizační jednotka

Filozofická fakulta

Klíčová slova anglicky

tagging; corpus; verb forms;

Příznaky

Recenzováno
Změněno: 12. 11. 2007 12:22, doc. PhDr. Klára Osolsobě, Dr.

Anotace

V originále

Článek se zabývá problematikou morfologických anotací jednoduchých slovesných tvarů v jazykových korpusech. Srovnává tagsety použité pro značkování slovesných tvarů v českých korpusech (SYN2000/SYN2005, DESAM, KSK) a návrh tagsetu pro značkování SNK.

Anglicky

The confrontation of two tagsets used for tagging of Czech corpora (SYN2000/SYN2005 and DESAM, KSK i.e. the corpus of private correspondence) and a tagset proposal for SNK (i. e. Slovak National Corpus) does not show substantial differences. Nevertheless individual cases differ in 1) lemmatisation and tagging of conditional verb forms (conditional particle) by, 2) tagging of free morpheme "s" (for 2. person singular i.e. ses, sis, žes, tys,...), 3) tagging of grammatical category of tense and voice and 4) lemmatisation and tagging of synthetic future forms. The comparison of the different solutions and the analysis of mistakes can be the first step to upgraded and reciprocally convertible tagsets.

Návaznosti

GA405/98/0746, projekt VaV
Název: Čeština v jazykovědných pojmech(Slovník)
Investor: Grantová agentura ČR, Čeština v jazykovědných pojmech(Slovník)