J 2007

Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů

OSOLSOBĚ, Klára

Basic information

Original name

Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů

Name in Czech

Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů

Name (in English)

Tagging of Verb Forms in Czech (Slovak) Corpora

Authors

OSOLSOBĚ, Klára (203 Czech Republic, guarantor)

Edition

Linguistica Brunensia, Brno, Masarykova Univerzita, 2007, 0231-7567

Other information

Language

Czech

Type of outcome

Článek v odborném periodiku

Field of Study

60200 6.2 Languages and Literature

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

RIV identification code

RIV/00216224:14210/07:00020581

Organization unit

Faculty of Arts

Keywords in English

tagging; corpus; verb forms;

Tags

Reviewed
Změněno: 12/11/2007 12:22, doc. PhDr. Klára Osolsobě, Dr.

Abstract

V originále

Článek se zabývá problematikou morfologických anotací jednoduchých slovesných tvarů v jazykových korpusech. Srovnává tagsety použité pro značkování slovesných tvarů v českých korpusech (SYN2000/SYN2005, DESAM, KSK) a návrh tagsetu pro značkování SNK.

In English

The confrontation of two tagsets used for tagging of Czech corpora (SYN2000/SYN2005 and DESAM, KSK i.e. the corpus of private correspondence) and a tagset proposal for SNK (i. e. Slovak National Corpus) does not show substantial differences. Nevertheless individual cases differ in 1) lemmatisation and tagging of conditional verb forms (conditional particle) by, 2) tagging of free morpheme "s" (for 2. person singular i.e. ses, sis, žes, tys,...), 3) tagging of grammatical category of tense and voice and 4) lemmatisation and tagging of synthetic future forms. The comparison of the different solutions and the analysis of mistakes can be the first step to upgraded and reciprocally convertible tagsets.

Links

GA405/98/0746, research and development project
Name: Čeština v jazykovědných pojmech(Slovník)
Investor: Czech Science Foundation, Czech Language in Linguistic Terms (a dictionary)