p
2011
The Art of Mathematics Retrieval (invited talk at Informatics Colloquium FI MU, 8.11.2011)
SOJKA, Petr
Základní údaje
Originální název
The Art of Mathematics Retrieval (invited talk at Informatics Colloquium FI MU, 8.11.2011)
Název česky
Umění vyhledávání matematiky (zvaná přednáška na Informatickém kolokviu FI MU, 8.11.2011)
Vydání
Informatics Colloquium, 2011
Další údaje
Typ výsledku
Vyžádané přednášky
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/11:00053852
Organizační jednotka
Fakulta informatiky
Klíčová slova česky
digitální matematická knihovna;vyhledávání;indexace;metadata s matematikou;DML-CZ; EuDML;MathML;TeX
Klíčová slova anglicky
digital library; math search;math retrieval;indexing of mathematics;metadata handling; EuDML; semantics of mathematical documents; knowledge management; digitization; MathML; portal-systems; repositories of knowledge; DML-CZ
Příznaky
Mezinárodní význam
V originále
The design and architecture of MIaS (Math Indexer and Searcher), a~system for mathematics retrieval is presented, and design decisions are discussed. We argue for an approach based on Presentation MathML using a~similarity of math subformulae. The system was implemented as a~math-aware search engine based on the state-of-the-art system Apache Lucene and is used in The European Digital Mathematics Library - EuDML. Scalability issues were checked against more than 400,000 arXiv documents with 158 million mathematical formulae. Almost three billion MathML subformulae were indexed using a~Solr-compatible Lucene.
Návaznosti
250503, interní kód MU | Název: The European Digital Mathematics Library (Akronym: EuDML) | Investor: Evropská unie, The European Digital Mathematics Library |
|
Zobrazeno: 8. 11. 2024 01:46