LÍŠKA, Martin. Vyhledávání v matematickém textu. Petr Sojka (školitel bakalářské práce). Brno: Masarykova univerzita, 2010, 35 s.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Vyhledávání v matematickém textu
Název česky Vyhledávání v matematickém textu
Název anglicky Searching Mathematical Texts
Autoři LÍŠKA, Martin (703 Slovensko, garant, domácí).
Petr Sojka (školitel bakalářské práce).
Vydání Brno, 35 s. 2010.
Nakladatel Masarykova univerzita
Další údaje
Originální jazyk slovenština
Typ výsledku Účelové publikace
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
WWW Archiv závěrečné práce
Kód RIV RIV/00216224:14330/10:00058915
Organizační jednotka Fakulta informatiky
Klíčová slova česky formula; vyhľadávanie; indexácia; MathML; Lucene; tokenizácia
Klíčová slova anglicky formula; searching; indexing; MathML; Lucene; tokenization
Štítky formula, indexing, Lucene, MathML, searching, tokenization
Změnil Změnil: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Změněno: 25. 1. 2013 13:57.
Anotace
Práca sa zaoberá problematikou vyhľadávania v matematických textoch. Rozoberá niekoľko existujúcich riešení vyhľadávania matematiky a z tohto sa snaží si odniesťi dôležité poznatky použité pri návrhu vlastného riešenia. Ten obsahuje idey a zdôvodnenia navrhnutých súčastí riešiacich vyhľadávanie matematiky, ako vhodná tokenizácia, úpravy a hodnotenie formúl. Časť venovaná implementácií tohoto návrhu popisuje ako bolo dosiahnuté konečné riešenie za použitia indexovacieho jadra Lucene. V závere dochádza k zhodnoteniu projektu a návrhom na ďalší vývoj.
Anotace anglicky
The thesis deals with an issue of searching in mathematical texts. It analyzes several existing approaches in mathematical aware searching and tries to collect notable observations for designing own solution. The design consist of ideas and considerations of components dealing with mathematical processing like tokenization, modifications and ranking of the formulae. Implementation part describes techniques used in achieving the final solution with the use of Lucene indexing core. Evaluation of the project and proposals for future development are stated in the end.
Návaznosti
LA09016, projekt VaVNázev: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Akronym: ERCIM)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Účast ČR v European Research Consortium for Informatics and Mathematics
250503, interní kód MUNázev: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library
VytisknoutZobrazeno: 28. 7. 2024 10:28