OSOLSOBĚ, Klára. Korpus soukromé korespondence (KSK) z hlediska morfologického značkování. Linguistica Brunensia. Brno: Masarykova Univerzita, 2006, A 54, č. 1, s. 187-201. ISSN 0231-7567.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Korpus soukromé korespondence (KSK) z hlediska morfologického značkování
Název anglicky Morphological tagging of KSK (Corpus of Private Corespondence)
Autoři OSOLSOBĚ, Klára (203 Česká republika, garant).
Vydání Linguistica Brunensia, Brno, Masarykova Univerzita, 2006, 0231-7567.
Další údaje
Originální jazyk čeština
Typ výsledku Článek v odborném periodiku
Obor 60200 6.2 Languages and Literature
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Kód RIV RIV/00216224:14210/06:00015822
Organizační jednotka Filozofická fakulta
Klíčová slova anglicky corpus tagging private corespondence
Štítky corpus tagging private corespondence
Změnil Změnila: doc. PhDr. Klára Osolsobě, Dr., učo 1996. Změněno: 24. 3. 2010 11:00.
Anotace
Značkování KSK přineslo řadu zkušeností, které je možné využít a) při značkování korpusů s vysokým počtem substandardních tvarů (korpusů mluvených, korpusů psaných textů nepodléhajících jazykové korekci atd.), b) při úpravě automatických morfologických analyzátorů pro takové typy korpusů, c) při teoretických úvahách o mezích a možnostech morfologického značkování jazykových korpusů a v neposlední řadě d) při tvorbě nových systémů značek (tagsetů), které by lépe odpovídaly skutečnosti jazyka, již jazykové korpusy reprezentují.
Anotace anglicky
The experience with annotating the KSK (i.e. the corpus of private correspondence) can be used a) by annotating corpora with a large number of substandard forms (spoken corpora, informal corpora, ...), b) by modification of automatical analyser for such types of corpora, c) by the theoretical consideration about limits and possibilities of tagging of the corpora and last but not least d) by project of new tagset.
Návaznosti
GV405/96/K214, projekt VaVNázev: Čeština ve věku počítačů: Textové korpusy a lexikální i gramatická základna pro rozvoj češtiny v 21. století
Investor: Grantová agentura ČR, Čeština ve věku počítačů: Textové korpusy a lexikální i gramatická základna pro rozvoj češtiny v 21. století
VytisknoutZobrazeno: 26. 4. 2024 18:14