LÍŠKA, Martin a Petr SOJKA. MIaS 1.5. 2014.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název MIaS 1.5
Autoři LÍŠKA, Martin (703 Slovensko, domácí) a Petr SOJKA (203 Česká republika, garant, domácí).
Vydání 2014.
Další údaje
Originální jazyk angličtina
Typ výsledku Software
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
WWW Domovská stránka projektu, zdrojové kódy
Kód RIV RIV/00216224:14330/14:00073351
Organizační jednotka Fakulta informatiky
Klíčová slova anglicky MIaS; Math Indexer and Searcher
Technické parametry MIaS je aplikace pre použití z příkazové řádky umožňující indexaci a vyhledávání nad dokumenty obsahujícími matematické zápisy. K tomuto využíva fulltextové vyhledávací jádro Lucene a vlastnou implementaci tokenizéru MIaSMath, který spracuje matematiku. Petr Sojka, FI MU Brno, Botanická 68a, 60200 Brno, CZ, tel. +420549496966
Příznaky Mezinárodní význam
Změnil Změnil: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Změněno: 25. 11. 2014 06:08.
Anotace
A math-aware, full-text indexing based search engine that enables users to search for mathematical formulae inside documents. Search engine is unique because it is able to index and search structural information like representation of mathematical formulae. There is no other software or IR system that is able to store three billions of formulae in its index and search it with response time below a second. MIaS processes documents containing mathematical notation in MathML format. The system is built as an extension to any full-text indexing engine and has been verifiend on state-of-the-art Lucene core. It is scalable - it was verified to index almost whole arxiv.org (440,000 papers) having more than 160,000,000 formulae. Software is being used in EuDML (eudml.org) and other digital libraries. For more details see papers in peer reviewed conferences: [1] Sojka, Petr; Líška, Martin. In Matthew R. B. Hardy, Frank Wm. Tompa. Proceedings of the 2011 ACM Symposium on Document Engineering. Mountain View, CA, USA : ACM, 2011. pp.57--60. [2] Sojka, Petr; Líška, Martin. In J.H.Davenport, W.M. Farmer, J.Urban, F. Rabe. Intelligent Computer Mathematics LNCS 6824. Springer, 2011, pp.228--243.
Návaznosti
LG13010, projekt VaVNázev: Zastoupení ČR v European Research Consortium for Informatics and Mathematics (Akronym: ERCIM-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Zastoupení ČR v European Research Consortium for Informatics and Mathematics
1ET200190513, projekt VaVNázev: DML-CZ: Česká digitální matematická knihovna
Investor: Akademie věd ČR, DML-CZ: Česká digitální matematická knihovna
VytisknoutZobrazeno: 25. 4. 2024 03:31