NOVOTNÝ, Vít a Petr SOJKA. Weighting of Passages in Question Answering. In Aleš Horák, Pavel Rychlý, Adam Rambousek. Proceedings of the Twelfth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2018. Brno: Tribun EU, 2018, s. 31-40. ISBN 978-80-263-1517-9.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Weighting of Passages in Question Answering
Autoři NOVOTNÝ, Vít (203 Česká republika, domácí) a Petr SOJKA (203 Česká republika, garant, domácí).
Vydání Brno, Proceedings of the Twelfth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2018, od s. 31-40, 10 s. 2018.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW Domovská stránka workshopu full paper
Kód RIV RIV/00216224:14330/18:00101863
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-1517-9
ISSN 2336-4289
UT WoS 000612420300005
Klíčová slova česky vyhledávání textů; odpovídání dotazů; Godwinův zákon; SemEval; vážení dokumentových pasáží
Klíčová slova anglicky passage retrieval; question answering; Godwin’s law; SemEval; weighting of document passages
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Vít Starý Novotný, Ph.D., učo 409729. Změněno: 3. 1. 2023 13:53.
Anotace
Modern text retrieval systems employ text segmentation during the indexing of documents. We show that, rather than returning the passages to the user, significant improvements are achieved on the semantic text similarity task on question answering (QA) datasets by combining all passages from a document into a single result with an aggregate similarity score. Following an analysis of the SemEval-2016 and 2017 task 3 datasets, we develop a weighted averaging operator that achieves state-of-the-art results on subtask B and can be implemented into existing search engines. Segmentation in information retrieval matters. Our results show that paying attention to important passages by using a task-specific weighting method leads to the best results on these question answering domain retrieval tasks.
Návaznosti
MUNI/A/1213/2017, interní kód MUNázev: Aplikovaný výzkum na FI: bezpečnost počítačových systémů, SW architektury kritických infrastruktur, zpracování velkých dat, vizualizace dat a virtuální realita
Investor: Masarykova univerzita, Aplikovaný výzkum na FI: bezpečnost počítačových systémů, SW architektury kritických infrastruktur, zpracování velkých dat, vizualizace dat a virtuální realita, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
TD03000295, projekt VaVNázev: Inteligentní software pro sémantické hledání dokumentů (Akronym: ISSHD)
Investor: Technologická agentura ČR, Inteligentní software pro sémantické hledání dokumentů
VytisknoutZobrazeno: 24. 5. 2024 02:29