J 2020

Three is Better than One: Ensembling Math Information Retrieval Systems

NOVOTNÝ, Vít, Petr SOJKA, Michal ŠTEFÁNIK a Dávid LUPTÁK

Základní údaje

Originální název

Three is Better than One: Ensembling Math Information Retrieval Systems

Autoři

NOVOTNÝ, Vít (203 Česká republika, domácí), Petr SOJKA (203 Česká republika, garant, domácí), Michal ŠTEFÁNIK (703 Slovensko, domácí) a Dávid LUPTÁK (703 Slovensko, domácí)

Vydání

CEUR Workshop Proceedings, Thessaloniki, Greece, M. Jeusfeld c/o Redaktion Sun SITE, Informatik V, RWTH Aachen. 2020, 1613-0073

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Řecko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/20:00116318

Organizační jednotka

Fakulta informatiky

Klíčová slova česky

vyhledávání matematiky; odpovědi na otázky; reprezentace matematiky; slovní embedingy; ansámbl

Klíčová slova anglicky

math information retrieval; question answering; math representations; word embeddings; ensembling

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 3. 1. 2023 13:53, RNDr. Vít Starý Novotný, Ph.D.

Anotace

V originále

We report on the systems that the Math Information Retrieval group at Masaryk University (MIRMU) prepared for tasks 1 (find answers) and 2 (formula search) of the ARQ Math lab at the CLEF conference. We prototyped three primary MIR systems, proposed several math representations to tackle the lab tasks, and evaluated the proposed systems and representations. We developed a novel algorithm for ensembling information retrieval systems that outperformed all our systems on task 1 and placed ninth out of the 23 competing submissions. Out-of-competition en sembles of all non-baseline primary submissions in the competition made available by the participants placed first on task 1 and third on task 2. Our prototypes will help to understand the challenging problems of answer and formula retrieval in the STEM domain and bring the possibility of accurate math information retrieval one step closer.

Návaznosti

MUNI/A/1076/2019, interní kód MU
Název: Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 20 (Akronym: SKOMU)
Investor: Masarykova univerzita, Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 20, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
MUNI/A/1411/2019, interní kód MU
Název: Aplikovaný výzkum: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, zpracování přirozeného jazyka a jazykové inženýrství, vizualizaci velkých dat a rozšířená realita.
Investor: Masarykova univerzita, Aplikovaný výzkum: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, zpracování přirozeného jazyka a jazykové inženýrství, vizualizaci velkých dat a rozšířená realita., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty