J 2006

Korpus soukromé korespondence (KSK) z hlediska morfologického značkování

OSOLSOBĚ, Klára

Základní údaje

Originální název

Korpus soukromé korespondence (KSK) z hlediska morfologického značkování

Název anglicky

Morphological tagging of KSK (Corpus of Private Corespondence)

Vydání

Linguistica Brunensia, Brno, Masarykova Univerzita, 2006, 0231-7567

Další údaje

Jazyk

čeština

Typ výsledku

Článek v odborném periodiku

Obor

60200 6.2 Languages and Literature

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14210/06:00015822

Organizační jednotka

Filozofická fakulta

Klíčová slova anglicky

corpus tagging private corespondence
Změněno: 24. 3. 2010 11:00, prof. PhDr. Klára Osolsobě, Dr.

Anotace

V originále

Značkování KSK přineslo řadu zkušeností, které je možné využít a) při značkování korpusů s vysokým počtem substandardních tvarů (korpusů mluvených, korpusů psaných textů nepodléhajících jazykové korekci atd.), b) při úpravě automatických morfologických analyzátorů pro takové typy korpusů, c) při teoretických úvahách o mezích a možnostech morfologického značkování jazykových korpusů a v neposlední řadě d) při tvorbě nových systémů značek (tagsetů), které by lépe odpovídaly skutečnosti jazyka, již jazykové korpusy reprezentují.

Anglicky

The experience with annotating the KSK (i.e. the corpus of private correspondence) can be used a) by annotating corpora with a large number of substandard forms (spoken corpora, informal corpora, ...), b) by modification of automatical analyser for such types of corpora, c) by the theoretical consideration about limits and possibilities of tagging of the corpora and last but not least d) by project of new tagset.

Návaznosti

GV405/96/K214, projekt VaV
Název: Čeština ve věku počítačů: Textové korpusy a lexikální i gramatická základna pro rozvoj češtiny v 21. století
Investor: Grantová agentura ČR, Čeština ve věku počítačů: Textové korpusy a lexikální i gramatická základna pro rozvoj češtiny v 21. století