D 2011

Web Interface and Collection for Mathematical Retrieval : WebMIaS and MREC

LÍŠKA, Martin, Petr SOJKA, Michal RŮŽIČKA a Peter MRAVEC

Základní údaje

Originální název

Web Interface and Collection for Mathematical Retrieval : WebMIaS and MREC

Název česky

Webové rozhraní a kolekce pro matematické vyhledávaní : WebMIaS a MREC

Autoři

LÍŠKA, Martin (703 Slovensko, domácí), Petr SOJKA (203 Česká republika, garant, domácí), Michal RŮŽIČKA (203 Česká republika, domácí) a Peter MRAVEC (703 Slovensko, domácí)

Vydání

Brno, DML 2011: Towards a Digital Mathematics Library, od s. 77-84, 8 s. 2011

Nakladatel

Masaryk University

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/11:00052769

Organizační jednotka

Fakulta informatiky

ISBN

978-80-210-5542-1

Klíčová slova česky

indexace matematiky a hledání; matematické digitální knihovny; informační systémy; hledání informací; hledání matematického obsahu; hodnocení matematických dokumentů; dolování v matematickém textu; WebMIaS; MIaS; Tralics; TeX; UMCL; Lucene

Klíčová slova anglicky

math indexing and retrieval; mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; WebMIaS; MIaS; Tralics; TeX; UMCL; Lucene

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 10. 5. 2013 12:57, doc. RNDr. Petr Sojka, Ph.D.

Anotace

V originále

We demonstrate searching of mathematical expressions in technical digital libraries on a MREC collection of 439,423 real scientific documents with more than 158 million mathematical formulae. Our solution - the WebMIaS system - allows the retrieval of mathematical expressions written in TEX or MathML. TEX queries are converted on-the-fly into tree representations of Presentation MathML, which is used for indexing. WebMIaS allows complex queries composed of plain text and mathematical formulae, using MIaS (Math Indexer and Searcher), a math aware search engine based on the state-of-the-art system Lucene. MIaS implements proximity math indexing with a subformulae similarity search.

Česky

Demonstrujeme hledání matematických vyrazů v technických digitálních knihovnách na kolekci MREC pozostávající z 429 423 reálných vedeckých dokumentů obsahujících více jak 158 milionů matematických vzorců. Naše řešení - systém WebMIas - umožňujě vyhledávaní matematických výrazů zapsaných v TeX-u nebo v MathML. Dotazy v TeX-u jsou konvertované do stromových reprezentací prezentačního MathML, které jsou použity pro indexaci. WebMIaS umožňujě komplexní dotazy složené z obyčejného textu a matematických formulí za použití MIaS (Math Indexer and Searcher), systému pro matematické vyhledávání založeno na systému Lucene. MIaS implementuje indexaci matematiky a vyhledávání podformulí na základe podobnosti.

Návaznosti

250503, interní kód MU
Název: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library