RŮŽIČKA, Michal, Petr SOJKA a Martin LÍŠKA. Math Indexer and Searcher under the Hood: History and Development of a Winning Strategy. In Noriko Kando, Hideo Joho, Kazuaki Kishida. Proceedings of the 11th NTCIR Conference on Evaluation of Information Access Technologies. Tokyo: National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 Japan, 2014, s. 127-134. ISBN 978-4-86049-065-2.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Math Indexer and Searcher under the Hood: History and Development of a Winning Strategy
Autoři RŮŽIČKA, Michal (203 Česká republika, domácí), Petr SOJKA (203 Česká republika, garant, domácí) a Martin LÍŠKA (703 Slovensko, domácí).
Vydání Tokyo, Proceedings of the 11th NTCIR Conference on Evaluation of Information Access Technologies, od s. 127-134, 8 s. 2014.
Nakladatel National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 Japan
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Japonsko
Utajení není předmětem státního či obchodního tajemství
Forma vydání paměťový nosič (CD, DVD, flash disk)
WWW poster Proceedings page preprint PDF final PDF conference web
Kód RIV RIV/00216224:14330/14:00076746
Organizační jednotka Fakulta informatiky
ISBN 978-4-86049-065-2
Klíčová slova česky MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika
Klíčová slova anglicky MIaS;MathML;math indexing and retrieval; canonical MathML;EuDML;mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; WebMIaS;TeX; Lucene
Štítky best1, firank_B
Příznaky Mezinárodní význam
Změnil Změnil: RNDr. Michal Růžička, Ph.D., učo 143424. Změněno: 2. 6. 2016 11:38.
Anotace
This paper describes and summarizes experiences of Masaryk University team MIRMU with the mathematical search performed for the NTCIR pilot Math Task. Our approach is the similarity search based on MathML Canonicalization and second generation of scalable full text search engine Math Indexer and Searcher (MIaS) with attested state-of-the-art information retrieval techniques. The capability of MIaS system in terms of the math query notation, normalization, combining math with textual query tokens was deployed by submitting multiple runs with four query notations provided, and with results merged from multiple queries. The analysis of the evaluation results shows that the system performs best using TeX queries that are translated and canonicalized to Content MathML.
Návaznosti
LG13010, projekt VaVNázev: Zastoupení ČR v European Research Consortium for Informatics and Mathematics (Akronym: ERCIM-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Zastoupení ČR v European Research Consortium for Informatics and Mathematics
MUNI/A/0765/2013, interní kód MUNázev: Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity (Akronym: SKOMU)
Investor: Masarykova univerzita, Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
VytisknoutZobrazeno: 25. 4. 2024 14:21