D 2011

Case study of BushBank concept

GRÁC, Marek

Základní údaje

Originální název

Case study of BushBank concept

Autoři

GRÁC, Marek (703 Slovensko, garant, domácí)

Vydání

Singapore, The 25th Pacific Asia Conference on Language, Information and Computation, od s. 353-361, 8 s. 2011

Nakladatel

Institute for Digital Enhancement of Cognitive Development, Waseda University

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

60200 6.2 Languages and Literature

Stát vydavatele

Singapur

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14330/11:00065905

Organizační jednotka

Fakulta informatiky

ISBN

978-4-905166-02-3

Klíčová slova anglicky

corpus; rapid development; annotation; treebank

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 30. 4. 2014 10:22, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

In this paper, we present a new type of annotated corpus, called BushBank, which improves handling of ambiguity in natural language. Unlike in traditional approaches where data are directly disambiguated, in a BushBank, disambiguation is done later, based on application needs. This has major impact on the structures used in the corpus, since ordinary syntactic trees disallow ambiguity. Our approach was tested on 10.000 sentences and more than a hundred annotators when creating Czech BushBank. The paper contains information about creating such a resource and the methods used to obtain high inter-annotator agreement.

Návaznosti

GAP401/10/0792, projekt VaV
Název: Temporální aspekty znalostí a informací
Investor: Grantová agentura ČR, Temporální aspekty znalostí a informací
LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky