D 2019

Czech Question Answering with Extended SQAD v3.0 Benchmark Dataset

SABOL, Radoslav, Marek MEDVEĎ a Aleš HORÁK

Základní údaje

Originální název

Czech Question Answering with Extended SQAD v3.0 Benchmark Dataset

Autoři

SABOL, Radoslav (703 Slovensko, domácí), Marek MEDVEĎ (703 Slovensko, domácí) a Aleš HORÁK (203 Česká republika, garant, domácí)

Vydání

Brno, Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2019, od s. 99-108, 10 s. 2019

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14330/19:00107857

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1530-8

ISSN

UT WoS

000604899800012

Klíčová slova anglicky

question answering; QA benchmark dataset; SQAD; Czech
Změněno: 15. 5. 2024 01:16, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

In this paper, we introduce a new version of the Simple QuestionAnswering Databases (SQAD). The main asset of the new version lies inincreasing the number of records to a total of 13,473 records. Besides thedatabase enlargement, the new version incorporates new restrictions ofspecifying different formats of the expected answer for a given question.These new restrictions are connected with automatic database consistencychecks where new sub-processes safeguard the database correctness andconsistency.We also introduce a new on-line annotation tool used which offered aunified environment for extending the SQAD data in a crowdsourcingexperiment.

Návaznosti

GA18-23891S, projekt VaV
Název: Hyperintensionální usuzování nad texty přirozeného jazyka
Investor: Grantová agentura ČR, Hyperintensionální usuzování nad texty přirozeného jazyka