u 2010

Vyhledávání v matematickém textu

LÍŠKA, Martin

Základní údaje

Originální název

Vyhledávání v matematickém textu

Název česky

Vyhledávání v matematickém textu

Název anglicky

Searching Mathematical Texts

Autoři

LÍŠKA, Martin (703 Slovensko, garant, domácí)
Petr Sojka (školitel bakalářské práce).

Vydání

Brno, 35 s. 2010

Nakladatel

Masarykova univerzita

Další údaje

Jazyk

slovenština

Typ výsledku

Účelové publikace

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/10:00058915

Organizační jednotka

Fakulta informatiky

Klíčová slova česky

formula; vyhľadávanie; indexácia; MathML; Lucene; tokenizácia

Klíčová slova anglicky

formula; searching; indexing; MathML; Lucene; tokenization
Změněno: 25. 1. 2013 13:57, doc. RNDr. Petr Sojka, Ph.D.

Anotace

V originále

Práca sa zaoberá problematikou vyhľadávania v matematických textoch. Rozoberá niekoľko existujúcich riešení vyhľadávania matematiky a z tohto sa snaží si odniesťi dôležité poznatky použité pri návrhu vlastného riešenia. Ten obsahuje idey a zdôvodnenia navrhnutých súčastí riešiacich vyhľadávanie matematiky, ako vhodná tokenizácia, úpravy a hodnotenie formúl. Časť venovaná implementácií tohoto návrhu popisuje ako bolo dosiahnuté konečné riešenie za použitia indexovacieho jadra Lucene. V závere dochádza k zhodnoteniu projektu a návrhom na ďalší vývoj.

Anglicky

The thesis deals with an issue of searching in mathematical texts. It analyzes several existing approaches in mathematical aware searching and tries to collect notable observations for designing own solution. The design consist of ideas and considerations of components dealing with mathematical processing like tokenization, modifications and ranking of the formulae. Implementation part describes techniques used in achieving the final solution with the use of Lucene indexing core. Evaluation of the project and proposals for future development are stated in the end.

Návaznosti

LA09016, projekt VaV
Název: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Akronym: ERCIM)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Účast ČR v European Research Consortium for Informatics and Mathematics
250503, interní kód MU
Název: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library