D 2011

Web Interface and Collection for Mathematical Retrieval : WebMIaS and MREC

LÍŠKA, Martin, Petr SOJKA, Michal RŮŽIČKA and Peter MRAVEC

Basic information

Original name

Web Interface and Collection for Mathematical Retrieval : WebMIaS and MREC

Name in Czech

Webové rozhraní a kolekce pro matematické vyhledávaní : WebMIaS a MREC

Authors

LÍŠKA, Martin (703 Slovakia, belonging to the institution), Petr SOJKA (203 Czech Republic, guarantor, belonging to the institution), Michal RŮŽIČKA (203 Czech Republic, belonging to the institution) and Peter MRAVEC (703 Slovakia, belonging to the institution)

Edition

Brno, DML 2011: Towards a Digital Mathematics Library, p. 77-84, 8 pp. 2011

Publisher

Masaryk University

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

Publication form

printed version "print"

References:

RIV identification code

RIV/00216224:14330/11:00052769

Organization unit

Faculty of Informatics

ISBN

978-80-210-5542-1

Keywords (in Czech)

indexace matematiky a hledání; matematické digitální knihovny; informační systémy; hledání informací; hledání matematického obsahu; hodnocení matematických dokumentů; dolování v matematickém textu; WebMIaS; MIaS; Tralics; TeX; UMCL; Lucene

Keywords in English

math indexing and retrieval; mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; WebMIaS; MIaS; Tralics; TeX; UMCL; Lucene

Tags

International impact, Reviewed
Změněno: 10/5/2013 12:57, doc. RNDr. Petr Sojka, Ph.D.

Abstract

V originále

We demonstrate searching of mathematical expressions in technical digital libraries on a MREC collection of 439,423 real scientific documents with more than 158 million mathematical formulae. Our solution - the WebMIaS system - allows the retrieval of mathematical expressions written in TEX or MathML. TEX queries are converted on-the-fly into tree representations of Presentation MathML, which is used for indexing. WebMIaS allows complex queries composed of plain text and mathematical formulae, using MIaS (Math Indexer and Searcher), a math aware search engine based on the state-of-the-art system Lucene. MIaS implements proximity math indexing with a subformulae similarity search.

In Czech

Demonstrujeme hledání matematických vyrazů v technických digitálních knihovnách na kolekci MREC pozostávající z 429 423 reálných vedeckých dokumentů obsahujících více jak 158 milionů matematických vzorců. Naše řešení - systém WebMIas - umožňujě vyhledávaní matematických výrazů zapsaných v TeX-u nebo v MathML. Dotazy v TeX-u jsou konvertované do stromových reprezentací prezentačního MathML, které jsou použity pro indexaci. WebMIaS umožňujě komplexní dotazy složené z obyčejného textu a matematických formulí za použití MIaS (Math Indexer and Searcher), systému pro matematické vyhledávání založeno na systému Lucene. MIaS implementuje indexaci matematiky a vyhledávání podformulí na základe podobnosti.

Links

250503, interní kód MU
Name: The European Digital Mathematics Library (Acronym: EuDML)
Investor: European Union