OSOLSOBĚ, Klára. Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů (Tagging of Verb Forms in Czech (Slovak) Corpora). Linguistica Brunensia. Brno: Masarykova Univerzita, 2007, A 55, No 1, p. 201-218. ISSN 0231-7567.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů
Name in Czech Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů
Name (in English) Tagging of Verb Forms in Czech (Slovak) Corpora
Authors OSOLSOBĚ, Klára (203 Czech Republic, guarantor).
Edition Linguistica Brunensia, Brno, Masarykova Univerzita, 2007, 0231-7567.
Other information
Original language Czech
Type of outcome Article in a journal
Field of Study 60200 6.2 Languages and Literature
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
RIV identification code RIV/00216224:14210/07:00020581
Organization unit Faculty of Arts
Keywords in English tagging; corpus; verb forms;
Tags corpus, tagging, verb forms
Tags Reviewed
Changed by Changed by: doc. PhDr. Klára Osolsobě, Dr., učo 1996. Changed: 12/11/2007 12:22.
Abstract
Článek se zabývá problematikou morfologických anotací jednoduchých slovesných tvarů v jazykových korpusech. Srovnává tagsety použité pro značkování slovesných tvarů v českých korpusech (SYN2000/SYN2005, DESAM, KSK) a návrh tagsetu pro značkování SNK.
Abstract (in English)
The confrontation of two tagsets used for tagging of Czech corpora (SYN2000/SYN2005 and DESAM, KSK i.e. the corpus of private correspondence) and a tagset proposal for SNK (i. e. Slovak National Corpus) does not show substantial differences. Nevertheless individual cases differ in 1) lemmatisation and tagging of conditional verb forms (conditional particle) by, 2) tagging of free morpheme "s" (for 2. person singular i.e. ses, sis, žes, tys,...), 3) tagging of grammatical category of tense and voice and 4) lemmatisation and tagging of synthetic future forms. The comparison of the different solutions and the analysis of mistakes can be the first step to upgraded and reciprocally convertible tagsets.
Links
GA405/98/0746, research and development projectName: Čeština v jazykovědných pojmech(Slovník)
Investor: Czech Science Foundation, Czech Language in Linguistic Terms (a dictionary)
PrintDisplayed: 26/4/2024 17:42