D 2019

Question and Answer Classification in Czech Question Answering Benchmark Dataset

MEDVEĎ, Marek, Aleš HORÁK a Daša KUŠNIRÁKOVÁ

Základní údaje

Originální název

Question and Answer Classification in Czech Question Answering Benchmark Dataset

Autoři

MEDVEĎ, Marek (703 Slovensko, garant, domácí), Aleš HORÁK (203 Česká republika) a Daša KUŠNIRÁKOVÁ (703 Slovensko)

Vydání

Prague, Czech Republic, Proceedings of the 11th International Conference on Agents and Artificial Intelligence, Volume 2, od s. 701-706, 6 s. 2019

Nakladatel

SCITEPRESS

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Kód RIV

RIV/00216224:14330/19:00107362

Organizační jednotka

Fakulta informatiky

ISBN

978-989-758-350-6

UT WoS

000671841000075

Klíčová slova anglicky

Question Answering; Question Classification; Answer Classification; Czech; Simple Question Answering Database; SQAD

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 14. 9. 2024 10:29, doc. RNDr. Aleš Horák, Ph.D.

Anotace

V originále

In this paper, we introduce a new updated version of the Czech Question Answering database SQAD v2.1 (Simple Question Answering Database) with the update being devoted to improved question and answer classification. The SQAD v2.1 database contains more than 8,500 question-answer pairs with all appropriate metadata for QA training and evaluation. We present the details and changes in the database structure as well as a new algorithm for detecting the question type and the actual answer type from the text of the question. The algorithm is evaluated with more than 4,000 question answer pairs reaching the F1-measure of 88% for question typed and 85% for answer type detection.

Návaznosti

GA18-23891S, projekt VaV
Název: Hyperintensionální usuzování nad texty přirozeného jazyka
Investor: Grantová agentura ČR, Hyperintensionální usuzování nad texty přirozeného jazyka
MUNI/A/1018/2018, interní kód MU
Název: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VIII.
Investor: Masarykova univerzita, Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VIII., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty