D 2016

VPS-GradeUp: Graded Decisions on Usage Patterns

BAISA, Vít, Silvie CINKOVA, Ema KREJČOVÁ a Anna VERNEROVÁ

Základní údaje

Originální název

VPS-GradeUp: Graded Decisions on Usage Patterns

Autoři

BAISA, Vít (203 Česká republika, domácí), Silvie CINKOVA (203 Česká republika), Ema KREJČOVÁ (203 Česká republika) a Anna VERNEROVÁ (203 Česká republika)

Vydání

Portorož, Slovenia, Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), od s. 823-827, 5 s. 2016

Nakladatel

European Language Resources Association (ELRA)

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Slovinsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Odkazy

Kód RIV

RIV/00216224:14330/16:00090124

Organizační jednotka

Fakulta informatiky

ISBN

978-2-9517408-9-1

Klíčová slova anglicky

Corpus Creation; Corpus Annotation; Word Sense Disambiguation; Validation of Language Resources

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 7. 6. 2016 16:46, Mgr. et Mgr. Vít Baisa, Ph.D.

Anotace

V originále

We present VPS-GradeUp - a set of 11,400 graded human decisions on usage patterns of 29 English lexical verbs from the Pattern Dictionary of English Verbs by Patrick Hanks. The annotation contains, for each verb lemma, a batch of 50 concordances with the given lemma as KWIC, and for each of these concordances we provide a graded human decision on how well the individual PDEV patterns for this particular lemma illustrate the given concordance, indicated on a 7-point Likert scale for each PDEV pattern. With our annotation, we were pursuing a pilot investigation of the foundations of human clustering and disambiguation decisions with respect to usage patterns of verbs in context. The data set is publicly available at http://hdl.handle.net/11234/1-1585.

Návaznosti

LM2015071, projekt VaV
Název: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
7F14047, projekt VaV
Název: Harvesting big text data for under-resourced languages (Akronym: HaBiT)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Harvesting big text data for under-resourced languages