HRDINA, Miroslav. Recognition of Mathematical Texts. Petr Sojka (školitel). Brno: Masarykova Univerzita, 2013, 42 s.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Recognition of Mathematical Texts
Název česky Rozpoznávání matematických textů
Autoři HRDINA, Miroslav (703 Slovensko, garant, domácí).
Petr Sojka (školitel).
Vydání Brno, 42 s. 2013.
Nakladatel Masarykova Univerzita
Další údaje
Originální jazyk angličtina
Typ výsledku Účelové publikace
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
WWW Archív záverečnej práce
Kód RIV RIV/00216224:14330/13:00067657
Organizační jednotka Fakulta informatiky
Klíčová slova anglicky OCR; math recognition; InftyReader; Tralics; MathML; EuDML
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 28. 4. 2014 06:23.
Anotace
This work aims to resolve the OCR issue for EuDML project with the most important part being the recognition of mathematical content. Goal of this work was to create workflow for mathematical OCR, which transforms the mathematical publications to indexable recognized output. This was achieved by using the InftyReader OCR software. The chosen recognition workflow was tested and results were evaluated. During recognition numerous problems with the software and recognized data were encountered. Part of these problems were resolved, but some are still pending and will be resolved in the future.
Anotace česky
Táto práca sa zameriava na vyriešenie problému rozpoznávania znakov pre projekt EuDML so zameraním na rozpoznávanie matematického obsahu. Cieľom práce bolo navrhnúť pracovný postup pre matematické OCR, ktorý transformuje matematické publikácie na indexovatelný rozpoznaný výstup. To bolo dosiahnuté použitím OCR sofvéru InftyReader. Zvolený postup práce bol otestovaný a výsledky boli vyhodnotené. Počas rozpoznávania došlo k viacerým problémom so softvérom aj s rozpoznávanými dátami. Časť týchto problémov bola vyriešená ale niektoré stále pretrvávajú a budú vyriešene v budúcnosti.
Návaznosti
LG13010, projekt VaVNázev: Zastoupení ČR v European Research Consortium for Informatics and Mathematics (Akronym: ERCIM-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Zastoupení ČR v European Research Consortium for Informatics and Mathematics
250503, interní kód MUNázev: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library
VytisknoutZobrazeno: 12. 10. 2024 01:17