ŠULGANOVÁ, Terézia, Marek MEDVEĎ a Aleš HORÁK. Enlargement of the Czech Question-Answering Dataset to SQAD v2.0. In Aleš Horák, Pavel Rychlý, Adam Rambousek. Proceedings of the Eleventh Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2017. Brno: Tribun EU, 2017, s. 79-84. ISBN 978-80-263-1340-3.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Enlargement of the Czech Question-Answering Dataset to SQAD v2.0
Autoři ŠULGANOVÁ, Terézia (703 Slovensko, garant, domácí), Marek MEDVEĎ (703 Slovensko, domácí) a Aleš HORÁK (203 Česká republika).
Vydání Brno, Proceedings of the Eleventh Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2017, od s. 79-84, 6 s. 2017.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW URL
Kód RIV RIV/00216224:14330/17:00095303
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-1340-3
ISSN 2336-4289
UT WoS 000426613500009
Klíčová slova anglicky question answering; QA dataset; SQAD
Příznaky Mezinárodní význam
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 27. 4. 2018 11:36.
Anotace
In this paper, we present the second version of Czech question-answering dataset called SQAD v2.0 (Simple Question Answering Database). The new version represents a large extension of our original SQAD database. In the current release, the dataset contains nearly 9,000 question-answer pairs completed with manual annotation of question and answer types. All texts in the dataset (the source documents, the question and the respective answer) are provided with complete morphological annotation in plain textual format. We offer detailed statistics of the SQAD v2.0 dataset based on the new QA annotation.
Návaznosti
GA15-13277S, projekt VaVNázev: Hyperintensionální logika pro analýzu přirozeného jazyka
Investor: Grantová agentura ČR, Hyperintensionální logika pro analýzu přirozeného jazyka
LM2015071, projekt VaVNázev: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
VytisknoutZobrazeno: 26. 4. 2024 09:11