Bakalářská práce

Vyhledávání v matematickém textu

Searching Mathematical texts

Martin Líška, učo 255768
Anotace

Práca sa zaoberá problematikou vyhľadávania v matematických textoch. Rozoberá niekoľko existujúcich riešení vyhľadávania matematiky a z tohto sa snaží si odniesťi dôležité poznatky použité pri návrhu vlastného riešenia. Ten obsahuje idey a zdôvodnenia navrhnutých súčastí riešiacich vyhľadávanie matematiky, ako vhodná tokenizácia, úpravy a hodnotenie formúl. Časť venovaná implementácií tohoto návrhu …více

Abstract

The thesis deals with an issue of searching in mathematical texts. It analyzes several existing approaches in mathematical aware searching and tries to collect notable observations for designing own solution. The design consist of ideas and considerations of components dealing with mathematical processing like tokenization, modifications and ranking of the formulae. Implementation part describes techniques …více

Zadání práce
Student se seznámí s dosavadními přístupy a možnostmi vyhledávání v korpusu matematických textů (MathDex, LaTeXtool, EgoMath,...) a vyhodnotí jejich výhody a nevýhody. Dále se seznámí s předchozími pracemi na podobné téma, konkrétně BP Petra Kišše https://is.muni.cz/auth/th/50804/fi_b/, BP Marka Chrenka https://is.muni.cz/auth/th/173261/fi_b_a2/ a DP Víta Dostála https://is.muni.cz/auth/th/72569/fi_m/. Student na základě zpracované řešerše navrhne řešení pro vyhledávání v repozitáři DML-CZ http://dml.cz. Jako praktická část bude oindexována část dat arXiv http://arxiv.org/ (příp. arXMLiv http://arxmliv.kwarc.info/) a provedeno vyhodnocení úspěšnosti vyhledávání (dotaz. jazyk, relevance, škálovatelnost) oproti předchozím řešením.
Práce zkontrolována:
21. 6. 2010 12:58, doc. RNDr. Petr Sojka, Ph.D., učo 2378
Plný text práce
521,2 KB / soubor PDF
Jazyk práce
slovenština slovenština
Termín obhajoby
23. 6. 2010
Práce byla úspěšně obhájena

Vedoucí

doc. RNDr. Petr Sojka, Ph.D., učo 2378
KVI FI MU

Oponent

Mgr. Vlastimil Krejčíř, učo 4189
KSOV ScColl CERIT-SC ÚVT MU

Literatura

  • MIŠUTKA, Jozef a Leo GALAMBOŠ. Extending Full Text Search Engine for Mathematical Content. In DML 2008: Towards Digital Mathematics Library. Brno: Masaryk University, 2008, s. 55-67. ISBN 978-80-210-4658-0.
  • MIŠUTKA, Jozef. Indexing Mathematical Content Using Full Text Search Engine. In WDS'08 Proceedings of Contributed Papers: Part I - Mathematics and Computer Sciences. Praha: Matfyzpress, 2008, s. 240-244. ISBN 978-80-7378-023-4.

Masarykova univerzita Fakulta informatiky
Studijní program
Informatika

Práce na příbuzné téma

Seznam prací, které mají shodná klíčová slova.

  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.