2011
Case study of BushBank concept
GRÁC, MarekZákladní údaje
Originální název
Case study of BushBank concept
Autoři
GRÁC, Marek (703 Slovensko, garant, domácí)
Vydání
Singapore, The 25th Pacific Asia Conference on Language, Information and Computation, od s. 353-361, 8 s. 2011
Nakladatel
Institute for Digital Enhancement of Cognitive Development, Waseda University
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
60200 6.2 Languages and Literature
Stát vydavatele
Singapur
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Kód RIV
RIV/00216224:14330/11:00065905
Organizační jednotka
Fakulta informatiky
ISBN
978-4-905166-02-3
Klíčová slova anglicky
corpus; rapid development; annotation; treebank
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 30. 4. 2014 10:22, RNDr. Pavel Šmerk, Ph.D.
Anotace
V originále
In this paper, we present a new type of annotated corpus, called BushBank, which improves handling of ambiguity in natural language. Unlike in traditional approaches where data are directly disambiguated, in a BushBank, disambiguation is done later, based on application needs. This has major impact on the structures used in the corpus, since ordinary syntactic trees disallow ambiguity. Our approach was tested on 10.000 sentences and more than a hundred annotators when creating Czech BushBank. The paper contains information about creating such a resource and the methods used to obtain high inter-annotator agreement.
Návaznosti
GAP401/10/0792, projekt VaV |
| ||
LC536, projekt VaV |
|