D 2018

Weighting of Passages in Question Answering

NOVOTNÝ, Vít a Petr SOJKA

Základní údaje

Originální název

Weighting of Passages in Question Answering

Autoři

NOVOTNÝ, Vít (203 Česká republika, domácí) a Petr SOJKA (203 Česká republika, garant, domácí)

Vydání

Brno, Proceedings of the Twelfth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2018, od s. 31-40, 10 s. 2018

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Domovská stránka workshopu full paper

Kód RIV

RIV/00216224:14330/18:00101863

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1517-9

ISSN

UT WoS

000612420300005

Klíčová slova česky

vyhledávání textů; odpovídání dotazů; Godwinův zákon; SemEval; vážení dokumentových pasáží

Klíčová slova anglicky

passage retrieval; question answering; Godwin’s law; SemEval; weighting of document passages

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 3. 1. 2023 13:53, RNDr. Vít Starý Novotný, Ph.D.

Anotace

V originále

Modern text retrieval systems employ text segmentation during the indexing of documents. We show that, rather than returning the passages to the user, significant improvements are achieved on the semantic text similarity task on question answering (QA) datasets by combining all passages from a document into a single result with an aggregate similarity score. Following an analysis of the SemEval-2016 and 2017 task 3 datasets, we develop a weighted averaging operator that achieves state-of-the-art results on subtask B and can be implemented into existing search engines. Segmentation in information retrieval matters. Our results show that paying attention to important passages by using a task-specific weighting method leads to the best results on these question answering domain retrieval tasks.

Návaznosti

MUNI/A/1213/2017, interní kód MU
Název: Aplikovaný výzkum na FI: bezpečnost počítačových systémů, SW architektury kritických infrastruktur, zpracování velkých dat, vizualizace dat a virtuální realita
Investor: Masarykova univerzita, Aplikovaný výzkum na FI: bezpečnost počítačových systémů, SW architektury kritických infrastruktur, zpracování velkých dat, vizualizace dat a virtuální realita, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
TD03000295, projekt VaV
Název: Inteligentní software pro sémantické hledání dokumentů (Akronym: ISSHD)
Investor: Technologická agentura ČR, Inteligentní software pro sémantické hledání dokumentů
Zobrazeno: 16. 11. 2024 04:08