RAMBOUSEK, Adam a Marek GRÁC. Anotácia dát. In Jiří Jelínek, Radim Jiroušek. Znalosti 2011, sborník příspěvků. Ostrava: Fakulta elektrotechniky a informatiky, VŠB-Technická univerzita Ostrava, 2011, s. 263-266. ISBN 978-80-248-2369-0.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Anotácia dát
Název česky Anotace dat
Název anglicky Data Annotation
Autoři RAMBOUSEK, Adam (203 Česká republika, domácí) a Marek GRÁC (703 Slovensko, garant, domácí).
Vydání Ostrava, Znalosti 2011, sborník příspěvků, od s. 263-266, 4 s. 2011.
Nakladatel Fakulta elektrotechniky a informatiky, VŠB-Technická univerzita Ostrava
Další údaje
Originální jazyk slovenština
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Slovensko
Utajení není předmětem státního či obchodního tajemství
WWW konference
Kód RIV RIV/00216224:14330/11:00051849
Organizační jednotka Fakulta informatiky
ISBN 978-80-248-2369-0
Klíčová slova česky anotace; korpusy; shoda anotátorů
Klíčová slova anglicky annotation;corpora;inter-annotator agreement
Štítky anotace, korpusy
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 18. 4. 2012 00:37.
Anotace
Práca s prirodzeným jazykom vyžaduje rozsiahle dátové zdroje -- korpusy. Čím viac informácií z nich dokážeme extrahovať, tým sú pre nás užitočnejšie. Niektoré úlohy však nie je možné kvalitne značkovať pomocou automatických nástrojov. V našom príspevku sa venujeme problematike manuálneho resp. poloautomatického značkovania jazykových zdrojov. Reflektujeme v nich skúsenosti získané z viacerých projektov, ktoré sa líšili množstvom anotátorov, ich skúsenosťami, druhom anotovaných dát a v neposlednej rade aj kvalitou anotátorov.
Anotace anglicky
Natural language processing needs large data resources -- corpora. The more information we can extract, the more useful they are. However it is not possible to annotate some information automatically in good quality. This paper deals with manual and semi-automatical annotation of language resources. It summarize the experience from several projects that differ in amount of annotators, their experience, data type and annotator quality.
Návaznosti
LC536, projekt VaVNázev: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
VytisknoutZobrazeno: 26. 4. 2024 20:41