D 2018

MIaS: Math-Aware Retrieval in Digital Mathematical Libraries

SOJKA, Petr, Michal RŮŽIČKA a Vít NOVOTNÝ

Základní údaje

Originální název

MIaS: Math-Aware Retrieval in Digital Mathematical Libraries

Autoři

SOJKA, Petr (203 Česká republika, garant, domácí), Michal RŮŽIČKA (203 Česká republika, domácí) a Vít NOVOTNÝ (203 Česká republika, domácí)

Vydání

Torino, Italy, Proceedings of the 27th ACM International Conference on Information and Knowledge Management (CIKM '18), od s. 1923-1926, 4 s. 2018

Nakladatel

Association for Computing Machinery

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Itálie

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Odkazy

Kód RIV

RIV/00216224:14330/18:00100679

Organizační jednotka

Fakulta informatiky

ISBN

978-1-4503-6014-2

UT WoS

000455712300261

Klíčová slova česky

vyhledávání matematiky; DML; EuDML; digitální matematické knihovny

Klíčová slova anglicky

Math Information Retrieval; DML; EuDML; Digital Mathematical Libraries

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 13. 5. 2020 19:25, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Digital mathematical libraries (DMLs) such as arXiv, Numdam, and EuDML contain mainly documents from STEM fields, where mathematical formulae are often more important than text for understanding. Conventional information retrieval (IR) systems are unable to represent formulae and they are therefore ill-suited for math information retrieval (MIR). To fill the gap, we have developed, and open-sourced the MIaS MIR system. MIaS is based on the full-text search engine Apache Lucene. On top of text retrieval, MIaS also incorporates a set of tools for preprocessing mathematical formulae. We describe the design of the system and present speed, and quality evaluation results. We show that MIaS is both efficient, and effective, as evidenced by our victory in the NTCIR-11 Math-2 task.

Návaznosti

MUNI/A/1213/2017, interní kód MU
Název: Aplikovaný výzkum na FI: bezpečnost počítačových systémů, SW architektury kritických infrastruktur, zpracování velkých dat, vizualizace dat a virtuální realita
Investor: Masarykova univerzita, Aplikovaný výzkum na FI: bezpečnost počítačových systémů, SW architektury kritických infrastruktur, zpracování velkých dat, vizualizace dat a virtuální realita, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
1ET200190513, projekt VaV
Název: DML-CZ: Česká digitální matematická knihovna
Investor: Akademie věd ČR, DML-CZ: Česká digitální matematická knihovna
250503, interní kód MU
Název: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library

Přiložené soubory