SOJKA, Petr. Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts. In ŠTULLER, Julius a Zdenka LINKOVÁ. Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu. první. Praha: Üstav informatiky AV ČR, 2006. s. 110-113, 4 s. ISBN 80-903298-7-X.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts
Název česky Budování digitální matematické knihovny: OCR matematických textů
Autoři SOJKA, Petr (203 Česká republika, garant).
Vydání první. Praha, Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu, od s. 110-113, 4 s. 2006.
Nakladatel Üstav informatiky AV ČR
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor Dokumentace, knihovnictví, práce s informacemi
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
WWW Full paper--proceedings
Kód RIV RIV/00216224:14330/06:00015510
Organizační jednotka Fakulta informatiky
ISBN 80-903298-7-X
Klíčová slova anglicky OCR; Optical Character Recognition; DML-CZ; digitization; Digital mathematics library project
Štítky Digital mathematics library project, digitization, DML-CZ, OCR, Optical Character Recognition
Příznaky Mezinárodní význam
Změnil Změnil: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Změněno: 7. 6. 2009 01:05.
Anotace
This paper describes a prototype of the OCR math engine built in the DML-CZ project. Solution stands on the combination of FineReader and InftyReader programmes. The achieved error rate (counting not only character errors, but also errors in the recognition of structure of mathematics notation) decreased from an initial 12\% to under 1\%.
Anotace česky
Článek popisuje prototyp řešení OCR matematických textů vztvořený pro skenovaná data projektu DML CZ. Řešení spočívá v kombinaci programů FineReader a InftyReader. Dosažená chybovost (počítave nejen překlepy, ale i chyby rozpoznání matematických formulí a tzpů písem) klesla z úvodních 12% pod 1%.
Návaznosti
1ET100300419, projekt VaVNázev: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Informační společnost (Národní program výzkumu)
1ET200190513, projekt VaVNázev: DML-CZ: Česká digitální matematická knihovna
Investor: Akademie věd ČR, Informační společnost (Národní program výzkumu)
VytisknoutZobrazeno: 24. 9. 2019 11:09