NOVOTNÝ, Vít, Petr SOJKA, Michal ŠTEFÁNIK a Dávid LUPTÁK. Three is Better than One: Ensembling Math Information Retrieval Systems. CEUR Workshop Proceedings. Thessaloniki, Greece: M. Jeusfeld c/o Redaktion Sun SITE, Informatik V, RWTH Aachen., roč. 2020, č. 2696, s. 93-122. ISSN 1613-0073. 2020.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Three is Better than One: Ensembling Math Information Retrieval Systems
Autoři NOVOTNÝ, Vít (203 Česká republika, domácí), Petr SOJKA (203 Česká republika, garant, domácí), Michal ŠTEFÁNIK (703 Slovensko, domácí) a Dávid LUPTÁK (703 Slovensko, domácí).
Vydání CEUR Workshop Proceedings, Thessaloniki, Greece, M. Jeusfeld c/o Redaktion Sun SITE, Informatik V, RWTH Aachen. 2020, 1613-0073.
Další údaje
Originální jazyk angličtina
Typ výsledku Článek v odborném periodiku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Řecko
Utajení není předmětem státního či obchodního tajemství
WWW PDF
Kód RIV RIV/00216224:14330/20:00116318
Organizační jednotka Fakulta informatiky
Klíčová slova česky vyhledávání matematiky; odpovědi na otázky; reprezentace matematiky; slovní embedingy; ansámbl
Klíčová slova anglicky math information retrieval; question answering; math representations; word embeddings; ensembling
Štítky information retrieval, machine learning, math indexing and retrieval, math information retrieval, MIR, SCM, similarity search, soft cosine measure
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Vít Starý Novotný, Ph.D., učo 409729. Změněno: 3. 1. 2023 13:53.
Anotace
We report on the systems that the Math Information Retrieval group at Masaryk University (MIRMU) prepared for tasks 1 (find answers) and 2 (formula search) of the ARQ Math lab at the CLEF conference. We prototyped three primary MIR systems, proposed several math representations to tackle the lab tasks, and evaluated the proposed systems and representations. We developed a novel algorithm for ensembling information retrieval systems that outperformed all our systems on task 1 and placed ninth out of the 23 competing submissions. Out-of-competition en sembles of all non-baseline primary submissions in the competition made available by the participants placed first on task 1 and third on task 2. Our prototypes will help to understand the challenging problems of answer and formula retrieval in the STEM domain and bring the possibility of accurate math information retrieval one step closer.
Návaznosti
MUNI/A/1076/2019, interní kód MUNázev: Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 20 (Akronym: SKOMU)
Investor: Masarykova univerzita, Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 20, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
MUNI/A/1411/2019, interní kód MUNázev: Aplikovaný výzkum: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, zpracování přirozeného jazyka a jazykové inženýrství, vizualizaci velkých dat a rozšířená realita.
Investor: Masarykova univerzita, Aplikovaný výzkum: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, zpracování přirozeného jazyka a jazykové inženýrství, vizualizaci velkých dat a rozšířená realita., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
VytisknoutZobrazeno: 19. 4. 2024 14:50