Informační systém MU
LÍŠKA, Martin, Petr SOJKA, Michal RŮŽIČKA and Peter MRAVEC. Web Interface and Collection for Mathematical Retrieval : WebMIaS and MREC. In Petr Sojka, Thierry Bouche. DML 2011: Towards a Digital Mathematics Library. Brno: Masaryk University, 2011. p. 77-84, 8 pp. ISBN 978-80-210-5542-1.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Web Interface and Collection for Mathematical Retrieval : WebMIaS and MREC
Name in Czech Webové rozhraní a kolekce pro matematické vyhledávaní : WebMIaS a MREC
Authors LÍŠKA, Martin (703 Slovakia, belonging to the institution), Petr SOJKA (203 Czech Republic, guarantor, belonging to the institution), Michal RŮŽIČKA (203 Czech Republic, belonging to the institution) and Peter MRAVEC (703 Slovakia, belonging to the institution).
Edition Brno, DML 2011: Towards a Digital Mathematics Library, p. 77-84, 8 pp. 2011.
Publisher Masaryk University
Other information
Original language English
Type of outcome Proceedings paper
Field of Study 10201 Computer sciences, information science, bioinformatics
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
Publication form printed version "print"
WWW URL
RIV identification code RIV/00216224:14330/11:00052769
Organization unit Faculty of Informatics
ISBN 978-80-210-5542-1
Keywords (in Czech) indexace matematiky a hledání; matematické digitální knihovny; informační systémy; hledání informací; hledání matematického obsahu; hodnocení matematických dokumentů; dolování v matematickém textu; WebMIaS; MIaS; Tralics; TeX; UMCL; Lucene
Keywords in English math indexing and retrieval; mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; WebMIaS; MIaS; Tralics; TeX; UMCL; Lucene
Tags International impact, Reviewed
Changed by Changed by: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Changed: 10/5/2013 12:57.
Abstract
We demonstrate searching of mathematical expressions in technical digital libraries on a MREC collection of 439,423 real scientific documents with more than 158 million mathematical formulae. Our solution - the WebMIaS system - allows the retrieval of mathematical expressions written in TEX or MathML. TEX queries are converted on-the-fly into tree representations of Presentation MathML, which is used for indexing. WebMIaS allows complex queries composed of plain text and mathematical formulae, using MIaS (Math Indexer and Searcher), a math aware search engine based on the state-of-the-art system Lucene. MIaS implements proximity math indexing with a subformulae similarity search.
Abstract (in Czech)
Demonstrujeme hledání matematických vyrazů v technických digitálních knihovnách na kolekci MREC pozostávající z 429 423 reálných vedeckých dokumentů obsahujících více jak 158 milionů matematických vzorců. Naše řešení - systém WebMIas - umožňujě vyhledávaní matematických výrazů zapsaných v TeX-u nebo v MathML. Dotazy v TeX-u jsou konvertované do stromových reprezentací prezentačního MathML, které jsou použity pro indexaci. WebMIaS umožňujě komplexní dotazy složené z obyčejného textu a matematických formulí za použití MIaS (Math Indexer and Searcher), systému pro matematické vyhledávání založeno na systému Lucene. MIaS implementuje indexaci matematiky a vyhledávání podformulí na základe podobnosti.
Links
250503, internal MU codeName: The European Digital Mathematics Library (Acronym: EuDML)
Investor: European Union, Competitiveness and inovation framework programme
Displayed: 28/3/2020 13:42