Detailed Information on Publication Record
2006
Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts
SOJKA, PetrBasic information
Original name
Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts
Name in Czech
Budování digitální matematické knihovny: OCR matematických textů
Authors
SOJKA, Petr (203 Czech Republic, guarantor)
Edition
první. Praha, Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu, p. 110-113, 4 pp. 2006
Publisher
Üstav informatiky AV ČR
Other information
Language
English
Type of outcome
Stať ve sborníku
Field of Study
Documentation, librarianship, work with information
Country of publisher
Czech Republic
Confidentiality degree
není předmětem státního či obchodního tajemství
References:
RIV identification code
RIV/00216224:14330/06:00015510
Organization unit
Faculty of Informatics
ISBN
80-903298-7-X
Keywords in English
OCR; Optical Character Recognition; DML-CZ; digitization; Digital mathematics library project
Tags
International impact
Změněno: 7/6/2009 01:05, doc. RNDr. Petr Sojka, Ph.D.
V originále
This paper describes a prototype of the OCR math engine built in the DML-CZ project. Solution stands on the combination of FineReader and InftyReader programmes. The achieved error rate (counting not only character errors, but also errors in the recognition of structure of mathematics notation) decreased from an initial 12\% to under 1\%.
In Czech
Článek popisuje prototyp řešení OCR matematických textů vztvořený pro skenovaná data projektu DML CZ. Řešení spočívá v kombinaci programů FineReader a InftyReader. Dosažená chybovost (počítave nejen překlepy, ale i chyby rozpoznání matematických formulí a tzpů písem) klesla z úvodních 12% pod 1%.
Links
1ET100300419, research and development project |
| ||
1ET200190513, research and development project |
|