2018
Weighting of Passages in Question Answering
NOVOTNÝ, Vít a Petr SOJKAZákladní údaje
Originální název
Weighting of Passages in Question Answering
Autoři
NOVOTNÝ, Vít (203 Česká republika, domácí) a Petr SOJKA (203 Česká republika, garant, domácí)
Vydání
Brno, Proceedings of the Twelfth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2018, od s. 31-40, 10 s. 2018
Nakladatel
Tribun EU
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Kód RIV
RIV/00216224:14330/18:00101863
Organizační jednotka
Fakulta informatiky
ISBN
978-80-263-1517-9
ISSN
UT WoS
000612420300005
Klíčová slova česky
vyhledávání textů; odpovídání dotazů; Godwinův zákon; SemEval; vážení dokumentových pasáží
Klíčová slova anglicky
passage retrieval; question answering; Godwin’s law; SemEval; weighting of document passages
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 3. 1. 2023 13:53, RNDr. Vít Starý Novotný, Ph.D.
Anotace
V originále
Modern text retrieval systems employ text segmentation during the indexing of documents. We show that, rather than returning the passages to the user, significant improvements are achieved on the semantic text similarity task on question answering (QA) datasets by combining all passages from a document into a single result with an aggregate similarity score. Following an analysis of the SemEval-2016 and 2017 task 3 datasets, we develop a weighted averaging operator that achieves state-of-the-art results on subtask B and can be implemented into existing search engines. Segmentation in information retrieval matters. Our results show that paying attention to important passages by using a task-specific weighting method leads to the best results on these question answering domain retrieval tasks.
Návaznosti
MUNI/A/1213/2017, interní kód MU |
| ||
TD03000295, projekt VaV |
|