D 2013

Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task

LÍŠKA, Martin, Petr SOJKA a Michal RŮŽIČKA

Základní údaje

Originální název

Similarity Search for Mathematics: Masaryk University team at the NTCIR-10 Math Task

Autoři

LÍŠKA, Martin (703 Slovensko, domácí), Petr SOJKA (203 Česká republika, garant, domácí) a Michal RŮŽIČKA (203 Česká republika, domácí)

Vydání

Tokyo, Proceedings of the 10th NTCIR Conference on Evaluation of Information Access Technologies, od s. 686-691, 6 s. 2013

Nakladatel

National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 Japan

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

paměťový nosič (CD, DVD, flash disk)

Kód RIV

RIV/00216224:14330/13:00068654

Organizační jednotka

Fakulta informatiky

ISBN

978-4-86049-062-1

Klíčová slova česky

MIaS;MathML;indexování;vyhledávání;kanonické MathML;EuDML;digitální knihovny;informační systémy;indexování hledání matematického obsahu včetně formulí;hodnocení relevance a podobnosti matematických článků;dolování v textech;DML-CZ;digitální matematická knihovna;sémantika

Klíčová slova anglicky

math indexing and retrieval; mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; WebMIaS; MIaS;TeX; Lucene

Štítky

Příznaky

Mezinárodní význam
Změněno: 28. 4. 2014 06:26, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

This paper describes and summarizes experiences of Masaryk University team MIRMU with the mathematical search performed for the NTCIR pilot Math Task. Our approach is the similarity search based on enhanced full text search utilizing attested state-of-the-art techniques and implementations. The variability of used Math Indexer and Searcher (MIaS) system in terms of the math query notation was tested by submitting multiple runs with four query notations provided. The analysis of the evaluation results shows that the system performs best using TeX queries that are translated to combined Presentation-Content MathML.

Návaznosti

LG13010, projekt VaV
Název: Zastoupení ČR v European Research Consortium for Informatics and Mathematics (Akronym: ERCIM-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Zastoupení ČR v European Research Consortium for Informatics and Mathematics
250503, interní kód MU
Název: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library

Přiložené soubory