Enlargement of the Czech Question-Answering Dataset to SQAD
v2.0

D 2017

Enlargement of the Czech Question-Answering Dataset to SQAD v2.0

ŠULGANOVÁ, Terézia, Marek MEDVEĎ a Aleš HORÁK

Základní údaje

Originální název

Enlargement of the Czech Question-Answering Dataset to SQAD v2.0

Autoři

ŠULGANOVÁ, Terézia (703 Slovensko, garant, domácí), Marek MEDVEĎ (703 Slovensko, domácí) a Aleš HORÁK (203 Česká republika)

Vydání

Brno, Proceedings of the Eleventh Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2017, od s. 79-84, 6 s. 2017

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

URL

Kód RIV

RIV/00216224:14330/17:00095303

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1340-3

ISSN

UT WoS

000426613500009

Klíčová slova anglicky

question answering; QA dataset; SQAD

Příznaky

Mezinárodní význam

Změněno: 27. 4. 2018 11:36, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

In this paper, we present the second version of Czech question-answering dataset called SQAD v2.0 (Simple Question Answering Database). The new version represents a large extension of our original SQAD database. In the current release, the dataset contains nearly 9,000 question-answer pairs completed with manual annotation of question and answer types. All texts in the dataset (the source documents, the question and the respective answer) are provided with complete morphological annotation in plain textual format. We offer detailed statistics of the SQAD v2.0 dataset based on the new QA annotation.

Návaznosti

GA15-13277S, projekt VaV

Název: Hyperintensionální logika pro analýzu přirozeného jazyka

Investor: Grantová agentura ČR, Hyperintensionální logika pro analýzu přirozeného jazyka

LM2015071, projekt VaV

Název: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)

Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum

Podrobný výpis o publikaci