2017
Enlargement of the Czech Question-Answering Dataset to SQAD v2.0
ŠULGANOVÁ, Terézia, Marek MEDVEĎ a Aleš HORÁKZákladní údaje
Originální název
Enlargement of the Czech Question-Answering Dataset to SQAD v2.0
Autoři
ŠULGANOVÁ, Terézia (703 Slovensko, garant, domácí), Marek MEDVEĎ (703 Slovensko, domácí) a Aleš HORÁK (203 Česká republika)
Vydání
Brno, Proceedings of the Eleventh Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2017, od s. 79-84, 6 s. 2017
Nakladatel
Tribun EU
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Odkazy
Kód RIV
RIV/00216224:14330/17:00095303
Organizační jednotka
Fakulta informatiky
ISBN
978-80-263-1340-3
ISSN
UT WoS
000426613500009
Klíčová slova anglicky
question answering; QA dataset; SQAD
Příznaky
Mezinárodní význam
Změněno: 27. 4. 2018 11:36, RNDr. Pavel Šmerk, Ph.D.
Anotace
V originále
In this paper, we present the second version of Czech question-answering dataset called SQAD v2.0 (Simple Question Answering Database). The new version represents a large extension of our original SQAD database. In the current release, the dataset contains nearly 9,000 question-answer pairs completed with manual annotation of question and answer types. All texts in the dataset (the source documents, the question and the respective answer) are provided with complete morphological annotation in plain textual format. We offer detailed statistics of the SQAD v2.0 dataset based on the new QA annotation.
Návaznosti
GA15-13277S, projekt VaV |
| ||
LM2015071, projekt VaV |
|