Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) ...
OSOLSOBĚ, Klára. Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů (Tagging of Verb Forms in Czech (Slovak) Corpora). Linguistica Brunensia. Brno: Masarykova Univerzita, 2007, A 55, No 1, p. 201-218. ISSN 0231-7567. |
Other formats:
BibTeX
LaTeX
RIS
|
Basic information | |
---|---|
Original name | Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů |
Name in Czech | Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů |
Name (in English) | Tagging of Verb Forms in Czech (Slovak) Corpora |
Authors | OSOLSOBĚ, Klára (203 Czech Republic, guarantor). |
Edition | Linguistica Brunensia, Brno, Masarykova Univerzita, 2007, 0231-7567. |
Other information | |
---|---|
Original language | Czech |
Type of outcome | Article in a journal |
Field of Study | 60200 6.2 Languages and Literature |
Country of publisher | Czech Republic |
Confidentiality degree | is not subject to a state or trade secret |
RIV identification code | RIV/00216224:14210/07:00020581 |
Organization unit | Faculty of Arts |
Keywords in English | tagging; corpus; verb forms; |
Tags | corpus, tagging, verb forms |
Tags | Reviewed |
Changed by | Changed by: doc. PhDr. Klára Osolsobě, Dr., učo 1996. Changed: 12/11/2007 12:22. |
Abstract |
---|
Článek se zabývá problematikou morfologických anotací jednoduchých slovesných tvarů v jazykových korpusech. Srovnává tagsety použité pro značkování slovesných tvarů v českých korpusech (SYN2000/SYN2005, DESAM, KSK) a návrh tagsetu pro značkování SNK. |
Abstract (in English) |
---|
The confrontation of two tagsets used for tagging of Czech corpora (SYN2000/SYN2005 and DESAM, KSK i.e. the corpus of private correspondence) and a tagset proposal for SNK (i. e. Slovak National Corpus) does not show substantial differences. Nevertheless individual cases differ in 1) lemmatisation and tagging of conditional verb forms (conditional particle) by, 2) tagging of free morpheme "s" (for 2. person singular i.e. ses, sis, žes, tys,...), 3) tagging of grammatical category of tense and voice and 4) lemmatisation and tagging of synthetic future forms. The comparison of the different solutions and the analysis of mistakes can be the first step to upgraded and reciprocally convertible tagsets. |
Links | |
---|---|
GA405/98/0746, research and development project | Name: Čeština v jazykovědných pojmech(Slovník) |
Investor: Czech Science Foundation, Czech Language in Linguistic Terms (a dictionary) |
PrintDisplayed: 11/10/2024 19:42