OSOLSOBĚ, Klára. Korpus soukromé korespondence (KSK) z hlediska morfologického značkování (Morphological tagging of KSK (Corpus of Private Corespondence)). Linguistica Brunensia. Brno: Masarykova Univerzita, 2006, A 54, No 1, p. 187-201. ISSN 0231-7567.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Korpus soukromé korespondence (KSK) z hlediska morfologického značkování
Name (in English) Morphological tagging of KSK (Corpus of Private Corespondence)
Authors OSOLSOBĚ, Klára (203 Czech Republic, guarantor).
Edition Linguistica Brunensia, Brno, Masarykova Univerzita, 2006, 0231-7567.
Other information
Original language Czech
Type of outcome Article in a journal
Field of Study 60200 6.2 Languages and Literature
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
RIV identification code RIV/00216224:14210/06:00015822
Organization unit Faculty of Arts
Keywords in English corpus tagging private corespondence
Tags corpus tagging private corespondence
Changed by Changed by: doc. PhDr. Klára Osolsobě, Dr., učo 1996. Changed: 24/3/2010 11:00.
Abstract
Značkování KSK přineslo řadu zkušeností, které je možné využít a) při značkování korpusů s vysokým počtem substandardních tvarů (korpusů mluvených, korpusů psaných textů nepodléhajících jazykové korekci atd.), b) při úpravě automatických morfologických analyzátorů pro takové typy korpusů, c) při teoretických úvahách o mezích a možnostech morfologického značkování jazykových korpusů a v neposlední řadě d) při tvorbě nových systémů značek (tagsetů), které by lépe odpovídaly skutečnosti jazyka, již jazykové korpusy reprezentují.
Abstract (in English)
The experience with annotating the KSK (i.e. the corpus of private correspondence) can be used a) by annotating corpora with a large number of substandard forms (spoken corpora, informal corpora, ...), b) by modification of automatical analyser for such types of corpora, c) by the theoretical consideration about limits and possibilities of tagging of the corpora and last but not least d) by project of new tagset.
Links
GV405/96/K214, research and development projectName: Čeština ve věku počítačů: Textové korpusy a lexikální i gramatická základna pro rozvoj češtiny v 21. století
Investor: Czech Science Foundation, Czech language in the era of computers. Text corpora and lexical and grammatical base for the development of Czech in the 21 st century
PrintDisplayed: 10/6/2024 06:38