PANÁK, Radovan a Petr SOJKA. Digitalizácia matematických textov. 2006.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Digitalizácia matematických textov
Název česky Digitalizace matematických textů
Název anglicky Digitalization of mathematics
Autoři PANÁK, Radovan (703 Slovensko) a Petr SOJKA (203 Česká republika, garant).
Vydání 2006.
Další údaje
Originální jazyk slovenština
Typ výsledku Projekty výzkumu a vývoje
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Kód RIV RIV/00216224:14330/06:00028750
Organizační jednotka Fakulta informatiky
Klíčová slova anglicky OCR; FineReader; InftyReader; XML; IML; DML CZ; structural analysis of mathematical expressions
Změnil Změnil: Mgr. Radovan Panák, učo 60587. Změněno: 16. 1. 2010 16:47.
Anotace
Práca sa venuje riešeniu problému OCR projektu digitálnej matematickej knižnice DML-CZ. Špecifické požiadavky vyplývajúce zo spracovania za účelom vytvorenia digitálnej matematickej knižnice si vyžiadali zvláštny prístup. Podobne aj spracovanie matematických textov si vyžaduje špeciálny prístup k niektorým problémom. Cieľom práce bolo umožniť automatizované spracovanie OCR v rámci projektu. Množstvo problémov sa podarilo uspokojivo vyriešiť, niektoré zostali čiastočne otvorené do budúcna. Zrejmé je, že procesy zabezpečujúce OCR je nutné pri automatizovanom dávkovom spracovaní objemov dát úrovne DML-CZ priebežne vylepšovať a prispôsobovať novým podmienkam. Implementácia riešení jednotlivých problémov je popísaná podrobnejšie.
Anotace česky
Práca sa venuje riešeniu problému OCR projektu digitálnej matematickej knižnice DML-CZ. Špecifické požiadavky vyplývajúce zo spracovania za účelom vytvorenia digitálnej matematickej knižnice si vyžiadali zvláštny prístup. Podobne aj spracovanie matematických textov si vyžaduje špeciálny prístup k niektorým problémom. Cieľom práce bolo umožniť automatizované spracovanie OCR v rámci projektu. Množstvo problémov sa podarilo uspokojivo vyriešiť, niektoré zostali čiastočne otvorené do budúcna. Zrejmé je, že procesy zabezpečujúce OCR je nutné pri automatizovanom dávkovom spracovaní objemov dát úrovne DML-CZ priebežne vylepšovať a prispôsobovať novým podmienkam. Implementácia riešení jednotlivých problémov je popísaná podrobnejšie.
Anotace anglicky
This thesis is about solving the OCR process for DML-CZ project. Common text and mathematical OCR methods are introduced to reader. In following chapters, our implemented solution is desribed and also how to improve it in future.
Návaznosti
1ET200190513, projekt VaVNázev: DML-CZ: Česká digitální matematická knihovna
Investor: Akademie věd ČR, DML-CZ: Česká digitální matematická knihovna
VytisknoutZobrazeno: 12. 5. 2024 23:49