D 2008

Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky

HLAVÁČKOVÁ, Dana a Klára OSOLSOBĚ

Základní údaje

Originální název

Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky

Název česky

Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky

Název anglicky

Tagging of Spoken Corpora

Autoři

HLAVÁČKOVÁ, Dana (203 Česká republika, garant, domácí) a Klára OSOLSOBĚ (203 Česká republika, domácí)
Kopřivová, Marie, Waclawičová, Martina.

Vydání

1. vyd. Praha, Čeština v mluveném korpusu, od s. 105-114, 10 s. 2008

Nakladatel

Nakladatelství Lidové noviny/ Ústav Českého národního korpusu

Další údaje

Jazyk

čeština

Typ výsledku

Stať ve sborníku

Obor

60200 6.2 Languages and Literature

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/08:00024286

Organizační jednotka

Fakulta informatiky

ISBN

978-80-7106-982-9

Klíčová slova anglicky

corpus; spoken corpora; tagging

Příznaky

Mezinárodní význam
Změněno: 19. 11. 2011 18:56, Mgr. Dana Hlaváčková, Ph.D.

Anotace

V originále

Cílem příspěvku je: a) Stručně shrnout zkušenosti získané při úpravách nástrojů primárně určených pro automatickou morfologickou analýzu psané češtiny s cílem rozšířit jejich použitelnost pro anotace mluvených korpusů. b) Představit nástroj upravenou verzi automatického morfologického analyzátoru ajka použitou pro automatické značkování mluvených korpusů. c) Podělit se o konkrétní zkušenosti s automatickou morfologickou analýzou a následnou ruční disambiguací automaticky označkovaných částí Brněnského mluveného korpusu (BMK) a Korpusu soukromé korespondence (KSK) oba vytvořeny v Ústavu českého jazyka FF MU. d) Na základě výše uvedených zkušeností zhodnotit klady a zápory, meze a možnosti automatické morfologické analýzy mluvených textů.

Anglicky

The aim of this paper is a) to summarize the conditions of tagging of spoken corpora, b) to project morphological tagger ajka, version for spoken czech corpora, c) to communicate the experienc of tagging and manual disambiguation of two corpora (bmk Corpus of spoken Czech in Brno and ksk Corpus of private corespondence) and d) to sum up pros and cones of authomatical morphological analysis of spoken corpora.

Návaznosti

1ET200610406, projekt VaV
Název: Jazyková poradna na internetu
Investor: Akademie věd ČR, Jazyková poradna na internetu