2006
Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts
SOJKA, PetrZákladní údaje
Originální název
Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts
Název česky
Budování digitální matematické knihovny: OCR matematických textů
Autoři
SOJKA, Petr (203 Česká republika, garant)
Vydání
první. Praha, Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu, od s. 110-113, 4 s. 2006
Nakladatel
Üstav informatiky AV ČR
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
Dokumentace, knihovnictví, práce s informacemi
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Kód RIV
RIV/00216224:14330/06:00015510
Organizační jednotka
Fakulta informatiky
ISBN
80-903298-7-X
Klíčová slova anglicky
OCR; Optical Character Recognition; DML-CZ; digitization; Digital mathematics library project
Štítky
Příznaky
Mezinárodní význam
Změněno: 7. 6. 2009 01:05, doc. RNDr. Petr Sojka, Ph.D.
V originále
This paper describes a prototype of the OCR math engine built in the DML-CZ project. Solution stands on the combination of FineReader and InftyReader programmes. The achieved error rate (counting not only character errors, but also errors in the recognition of structure of mathematics notation) decreased from an initial 12\% to under 1\%.
Česky
Článek popisuje prototyp řešení OCR matematických textů vztvořený pro skenovaná data projektu DML CZ. Řešení spočívá v kombinaci programů FineReader a InftyReader. Dosažená chybovost (počítave nejen překlepy, ale i chyby rozpoznání matematických formulí a tzpů písem) klesla z úvodních 12% pod 1%.
Návaznosti
1ET100300419, projekt VaV |
| ||
1ET200190513, projekt VaV |
|