D 2014

Low Inter-Annotator Agreement = An Ill-Defined Problem?

KOVÁŘ, Vojtěch, Pavel RYCHLÝ a Miloš JAKUBÍČEK

Základní údaje

Originální název

Low Inter-Annotator Agreement = An Ill-Defined Problem?

Autoři

KOVÁŘ, Vojtěch (203 Česká republika, garant, domácí), Pavel RYCHLÝ (203 Česká republika, domácí) a Miloš JAKUBÍČEK (203 Česká republika, domácí)

Vydání

Brno, Eighth Workshop on Recent Advances in Slavonic Natural Language Processing, od s. 57-62, 6 s. 2014

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/14:00077512

Organizační jednotka

Fakulta informatiky

ISSN

UT WoS

000374560500007

Klíčová slova anglicky

NLP; inter-annotator agreement; low inter-annotator agreement; evaluation

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 7. 6. 2021 17:27, doc. Mgr. Pavel Rychlý, Ph.D.

Anotace

V originále

nnotation tasks where the inter-annotator agreement is low are usually considered ill-defined and not worth attention. Such tasks are also considered unsuitable for algorithmic solution and for evaluation of computer programs that aim at solving them. However, there is a lot of problems (not only) in the natural language processing field that are practically defined and do have this nature, and we need computer programs that are able to solve them. The paper illustrates such problems on particular examples and suggests methodology that will enable training and evaluating tools using data with low inter-annotator agreement.

Návaznosti

LM2010013, projekt VaV
Název: LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
7F14047, projekt VaV
Název: Harvesting big text data for under-resourced languages (Akronym: HaBiT)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Harvesting big text data for under-resourced languages