p 2011

The Art of Mathematics Retrieval (invited talk at Informatics Colloquium FI MU, 8.11.2011)

SOJKA, Petr

Základní údaje

Originální název

The Art of Mathematics Retrieval (invited talk at Informatics Colloquium FI MU, 8.11.2011)

Název česky

Umění vyhledávání matematiky (zvaná přednáška na Informatickém kolokviu FI MU, 8.11.2011)

Autoři

SOJKA, Petr (203 Česká republika, garant, domácí)

Vydání

Informatics Colloquium, 2011

Další údaje

Jazyk

angličtina

Typ výsledku

Vyžádané přednášky

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/11:00053852

Organizační jednotka

Fakulta informatiky

Klíčová slova česky

digitální matematická knihovna;vyhledávání;indexace;metadata s matematikou;DML-CZ; EuDML;MathML;TeX

Klíčová slova anglicky

digital library; math search;math retrieval;indexing of mathematics;metadata handling; EuDML; semantics of mathematical documents; knowledge management; digitization; MathML; portal-systems; repositories of knowledge; DML-CZ

Příznaky

Mezinárodní význam
Změněno: 9. 11. 2011 15:37, doc. RNDr. Petr Sojka, Ph.D.

Anotace

V originále

The design and architecture of MIaS (Math Indexer and Searcher), a~system for mathematics retrieval is presented, and design decisions are discussed. We argue for an approach based on Presentation MathML using a~similarity of math subformulae. The system was implemented as a~math-aware search engine based on the state-of-the-art system Apache Lucene and is used in The European Digital Mathematics Library - EuDML. Scalability issues were checked against more than 400,000 arXiv documents with 158 million mathematical formulae. Almost three billion MathML subformulae were indexed using a~Solr-compatible Lucene.

Návaznosti

250503, interní kód MU
Název: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library