SOJKA, Petr, Vít NOVOTNÝ, Eniafe Festus AYETIRAN, Dávid LUPTÁK a Michal ŠTEFÁNIK. Quo Vadis, Math Information Retrieval. In Aleš Horák and Pavel Rychlý and Adam Rambousek. Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2019. Brno: Tribun EU. s. 117-128. ISBN 978-80-263-1517-9. 2019.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Quo Vadis, Math Information Retrieval
Autoři SOJKA, Petr (203 Česká republika, garant, domácí), Vít NOVOTNÝ (203 Česká republika, domácí), Eniafe Festus AYETIRAN (566 Nigérie, domácí), Dávid LUPTÁK (703 Slovensko, domácí) a Michal ŠTEFÁNIK (703 Slovensko, domácí).
Vydání Brno, Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2019, od s. 117-128, 12 s. 2019.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW full paper Domovská stránka workshopu
Kód RIV RIV/00216224:14330/19:00111500
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-1517-9
ISSN 2336-4289
UT WoS 000604899800014
Klíčová slova česky matematické získávání znalostí; zodpovídání dotazů; STEM; digitální matematické knihovny; embeddingy; MIaS; MIaSNG; DML
Klíčová slova anglicky math information retrieval; question answering; STEM; digital mathematical libraries; embeddings; MIaS; MIaSNG; DML
Štítky digital mathematical libraries, information retrieval, math indexing and retrieval, math information retrieval, MathML, MIaS, similarity search, soft cosine measure
Příznaky Mezinárodní význam
Změnil Změnil: RNDr. Vít Starý Novotný, Ph.D., učo 409729. Změněno: 3. 1. 2023 13:53.
Anotace
With the exponential growth of information in the digital form, information retrieval and querying digital libraries is of paramount importance, and mathematical and technical STEM documents are not an exception. The key for precise searching is the adequate and unambiguous representation of documents, paragraphs, sentences and words, which we are going to evaluate. We are presenting a roadmap to tackle the problem of searching and question answering in the digital mathematical libraries, and discuss the pros and cons of promising approaches primarily for the key part, namely the document representation: several types of embeddings, topic mixtures and LSTM. The listed representation learning options will be evaluated at the next ARQMath evaluation lab of CLEF 2020 conference.
Návaznosti
MUNI/A/1145/2018, interní kód MUNázev: Aplikovaný výzkum na FI: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, techniky pro zpracování a vizualizaci velkých dat a rozšířená realita.
Investor: Masarykova univerzita, Aplikovaný výzkum na FI: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, techniky pro zpracování a vizualizaci velkých dat a rozšířená realita., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
VytisknoutZobrazeno: 18. 4. 2024 18:16