HLAVÁČKOVÁ, Dana a Klára OSOLSOBĚ. Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky. Kopřivová, Marie, Waclawičová, Martina. In Čeština v mluveném korpusu. 1. vyd. Praha: Nakladatelství Lidové noviny/ Ústav Českého národního korpusu, 2008, s. 105-114. ISBN 978-80-7106-982-9.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky
Název česky Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky
Název anglicky Tagging of Spoken Corpora
Autoři HLAVÁČKOVÁ, Dana (203 Česká republika, garant, domácí) a Klára OSOLSOBĚ (203 Česká republika, domácí).
Kopřivová, Marie, Waclawičová, Martina.
Vydání 1. vyd. Praha, Čeština v mluveném korpusu, od s. 105-114, 10 s. 2008.
Nakladatel Nakladatelství Lidové noviny/ Ústav Českého národního korpusu
Další údaje
Originální jazyk čeština
Typ výsledku Stať ve sborníku
Obor 60200 6.2 Languages and Literature
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Kód RIV RIV/00216224:14330/08:00024286
Organizační jednotka Fakulta informatiky
ISBN 978-80-7106-982-9
Klíčová slova anglicky corpus; spoken corpora; tagging
Štítky corpus, spoken corpora, tagging
Příznaky Mezinárodní význam
Změnil Změnila: Mgr. Dana Hlaváčková, Ph.D., učo 17907. Změněno: 19. 11. 2011 18:56.
Anotace
Cílem příspěvku je: a) Stručně shrnout zkušenosti získané při úpravách nástrojů primárně určených pro automatickou morfologickou analýzu psané češtiny s cílem rozšířit jejich použitelnost pro anotace mluvených korpusů. b) Představit nástroj upravenou verzi automatického morfologického analyzátoru ajka použitou pro automatické značkování mluvených korpusů. c) Podělit se o konkrétní zkušenosti s automatickou morfologickou analýzou a následnou ruční disambiguací automaticky označkovaných částí Brněnského mluveného korpusu (BMK) a Korpusu soukromé korespondence (KSK) oba vytvořeny v Ústavu českého jazyka FF MU. d) Na základě výše uvedených zkušeností zhodnotit klady a zápory, meze a možnosti automatické morfologické analýzy mluvených textů.
Anotace anglicky
The aim of this paper is a) to summarize the conditions of tagging of spoken corpora, b) to project morphological tagger ajka, version for spoken czech corpora, c) to communicate the experienc of tagging and manual disambiguation of two corpora (bmk Corpus of spoken Czech in Brno and ksk Corpus of private corespondence) and d) to sum up pros and cones of authomatical morphological analysis of spoken corpora.
Návaznosti
1ET200610406, projekt VaVNázev: Jazyková poradna na internetu
Investor: Akademie věd ČR, Jazyková poradna na internetu
VytisknoutZobrazeno: 26. 4. 2024 13:36