2013
Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task
LÍŠKA, Martin, Petr SOJKA a Michal RŮŽIČKAZákladní údaje
Originální název
Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task
Autoři
LÍŠKA, Martin (703 Slovensko, domácí), Petr SOJKA (203 Česká republika, garant, domácí) a Michal RŮŽIČKA (203 Česká republika, domácí)
Vydání
Tokyo, Proceedings of the 10th NTCIR Conference on Evaluation of Information Access Technologies, od s. 686-691, 6 s. 2013
Nakladatel
National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 Japan
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
paměťový nosič (CD, DVD, flash disk)
Kód RIV
RIV/00216224:14330/13:00068654
Organizační jednotka
Fakulta informatiky
ISBN
978-4-86049-062-1
Klíčová slova česky
MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika
Klíčová slova anglicky
math indexing and retrieval; mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; WebMIaS; MIaS;TeX; Lucene
Štítky
Příznaky
Mezinárodní význam
Změněno: 28. 4. 2014 06:26, RNDr. Pavel Šmerk, Ph.D.
Anotace
V originále
This paper describes and summarizes experiences of Masaryk University team MIRMU with the mathematical search performed for the NTCIR pilot Math Task. Our approach is the similarity search based on enhanced full text search utilizing attested state-of-the-art techniques and implementations. The variability of used Math Indexer and Searcher (MIaS) system in terms of the math query notation was tested by submitting multiple runs with four query notations provided. The analysis of the evaluation results shows that the system performs best using TeX queries that are translated to combined Presentation-Content MathML.
Návaznosti
LG13010, projekt VaV |
| ||
250503, interní kód MU |
|