2008
Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky
HLAVÁČKOVÁ, Dana a Klára OSOLSOBĚZákladní údaje
Originální název
Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky
Název česky
Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky
Název anglicky
Tagging of Spoken Corpora
Autoři
HLAVÁČKOVÁ, Dana (203 Česká republika, garant, domácí) a Klára OSOLSOBĚ (203 Česká republika, domácí)
Kopřivová, Marie, Waclawičová, Martina.
Kopřivová, Marie, Waclawičová, Martina.
Vydání
1. vyd. Praha, Čeština v mluveném korpusu, od s. 105-114, 10 s. 2008
Nakladatel
Nakladatelství Lidové noviny/ Ústav Českého národního korpusu
Další údaje
Jazyk
čeština
Typ výsledku
Stať ve sborníku
Obor
60200 6.2 Languages and Literature
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/08:00024286
Organizační jednotka
Fakulta informatiky
ISBN
978-80-7106-982-9
Klíčová slova anglicky
corpus; spoken corpora; tagging
Štítky
Příznaky
Mezinárodní význam
Změněno: 19. 11. 2011 18:56, Mgr. Dana Hlaváčková, Ph.D.
V originále
Cílem příspěvku je: a) Stručně shrnout zkušenosti získané při úpravách nástrojů primárně určených pro automatickou morfologickou analýzu psané češtiny s cílem rozšířit jejich použitelnost pro anotace mluvených korpusů. b) Představit nástroj upravenou verzi automatického morfologického analyzátoru ajka použitou pro automatické značkování mluvených korpusů. c) Podělit se o konkrétní zkušenosti s automatickou morfologickou analýzou a následnou ruční disambiguací automaticky označkovaných částí Brněnského mluveného korpusu (BMK) a Korpusu soukromé korespondence (KSK) oba vytvořeny v Ústavu českého jazyka FF MU. d) Na základě výše uvedených zkušeností zhodnotit klady a zápory, meze a možnosti automatické morfologické analýzy mluvených textů.
Anglicky
The aim of this paper is a) to summarize the conditions of tagging of spoken corpora, b) to project morphological tagger ajka, version for spoken czech corpora, c) to communicate the experienc of tagging and manual disambiguation of two corpora (bmk Corpus of spoken Czech in Brno and ksk Corpus of private corespondence) and d) to sum up pros and cones of authomatical morphological analysis of spoken corpora.
Návaznosti
1ET200610406, projekt VaV |
|