2014
Math Indexer and Searcher under the Hood: History and Development of a Winning Strategy
RŮŽIČKA, Michal, Petr SOJKA a Martin LÍŠKAZákladní údaje
Originální název
Math Indexer and Searcher under the Hood: History and Development of a Winning Strategy
Autoři
RŮŽIČKA, Michal (203 Česká republika, domácí), Petr SOJKA (203 Česká republika, garant, domácí) a Martin LÍŠKA (703 Slovensko, domácí)
Vydání
Tokyo, Proceedings of the 11th NTCIR Conference on Evaluation of Information Access Technologies, od s. 127-134, 8 s. 2014
Nakladatel
National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 Japan
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Japonsko
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
paměťový nosič (CD, DVD, flash disk)
Kód RIV
RIV/00216224:14330/14:00076746
Organizační jednotka
Fakulta informatiky
ISBN
978-4-86049-065-2
Klíčová slova česky
MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika
Klíčová slova anglicky
MIaS;MathML;math indexing and retrieval; canonical MathML;EuDML;mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; WebMIaS;TeX; Lucene
Příznaky
Mezinárodní význam
Změněno: 2. 6. 2016 11:38, RNDr. Michal Růžička, Ph.D.
Anotace
V originále
This paper describes and summarizes experiences of Masaryk University team MIRMU with the mathematical search performed for the NTCIR pilot Math Task. Our approach is the similarity search based on MathML Canonicalization and second generation of scalable full text search engine Math Indexer and Searcher (MIaS) with attested state-of-the-art information retrieval techniques. The capability of MIaS system in terms of the math query notation, normalization, combining math with textual query tokens was deployed by submitting multiple runs with four query notations provided, and with results merged from multiple queries. The analysis of the evaluation results shows that the system performs best using TeX queries that are translated and canonicalized to Content MathML.
Návaznosti
LG13010, projekt VaV |
| ||
MUNI/A/0765/2013, interní kód MU |
|