2019
Czech Question Answering with Extended SQAD v3.0 Benchmark Dataset
SABOL, Radoslav, Marek MEDVEĎ a Aleš HORÁKZákladní údaje
Originální název
Czech Question Answering with Extended SQAD v3.0 Benchmark Dataset
Autoři
SABOL, Radoslav (703 Slovensko, domácí), Marek MEDVEĎ (703 Slovensko, domácí) a Aleš HORÁK (203 Česká republika, garant, domácí)
Vydání
Brno, Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2019, od s. 99-108, 10 s. 2019
Nakladatel
Tribun EU
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10200 1.2 Computer and information sciences
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Kód RIV
RIV/00216224:14330/19:00107857
Organizační jednotka
Fakulta informatiky
ISBN
978-80-263-1530-8
ISSN
UT WoS
000604899800012
Klíčová slova anglicky
question answering; QA benchmark dataset; SQAD; Czech
Změněno: 15. 5. 2024 01:16, RNDr. Pavel Šmerk, Ph.D.
Anotace
V originále
In this paper, we introduce a new version of the Simple QuestionAnswering Databases (SQAD). The main asset of the new version lies inincreasing the number of records to a total of 13,473 records. Besides thedatabase enlargement, the new version incorporates new restrictions ofspecifying different formats of the expected answer for a given question.These new restrictions are connected with automatic database consistencychecks where new sub-processes safeguard the database correctness andconsistency.We also introduce a new on-line annotation tool used which offered aunified environment for extending the SQAD data in a crowdsourcingexperiment.
Návaznosti
GA18-23891S, projekt VaV |
|