GRÁC, Marek. Case study of BushBank concept. Online. In The 25th Pacific Asia Conference on Language, Information and Computation. Singapore: Institute for Digital Enhancement of Cognitive Development, Waseda University, 2011. s. 353-361, 8 s. ISBN 978-4-905166-02-3. [citováno 2024-04-23]
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Case study of BushBank concept
Autoři GRÁC, Marek (703 Slovensko, garant, domácí)
Vydání Singapore, The 25th Pacific Asia Conference on Language, Information and Computation, od s. 353-361, 8 s. 2011.
Nakladatel Institute for Digital Enhancement of Cognitive Development, Waseda University
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 60200 6.2 Languages and Literature
Stát vydavatele Singapur
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
Kód RIV RIV/00216224:14330/11:00065905
Organizační jednotka Fakulta informatiky
ISBN 978-4-905166-02-3
Klíčová slova anglicky corpus; rapid development; annotation; treebank
Štítky best1
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 30. 4. 2014 10:22.
Anotace
In this paper, we present a new type of annotated corpus, called BushBank, which improves handling of ambiguity in natural language. Unlike in traditional approaches where data are directly disambiguated, in a BushBank, disambiguation is done later, based on application needs. This has major impact on the structures used in the corpus, since ordinary syntactic trees disallow ambiguity. Our approach was tested on 10.000 sentences and more than a hundred annotators when creating Czech BushBank. The paper contains information about creating such a resource and the methods used to obtain high inter-annotator agreement.
Návaznosti
GAP401/10/0792, projekt VaVNázev: Temporální aspekty znalostí a informací
Investor: Grantová agentura ČR, Temporální aspekty znalostí a informací
LC536, projekt VaVNázev: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
VytisknoutZobrazeno: 23. 4. 2024 11:52