SOJKA, Petr. Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts. In ŠTULLER, Julius and Zdenka LINKOVÁ. Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu. první. Praha: Üstav informatiky AV ČR, 2006. p. 110-113, 4 pp. ISBN 80-903298-7-X.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts
Name in Czech Budování digitální matematické knihovny: OCR matematických textů
Authors SOJKA, Petr (203 Czech Republic, guarantor).
Edition první. Praha, Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu, p. 110-113, 4 pp. 2006.
Publisher Üstav informatiky AV ČR
Other information
Original language English
Type of outcome Proceedings paper
Field of Study Documentation, librarianship, work with information
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
WWW Full paper--proceedings
RIV identification code RIV/00216224:14330/06:00015510
Organization unit Faculty of Informatics
ISBN 80-903298-7-X
Keywords in English OCR; Optical Character Recognition; DML-CZ; digitization; Digital mathematics library project
Tags Digital mathematics library project, digitization, DML-CZ, OCR, Optical Character Recognition
Tags International impact
Changed by Changed by: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Changed: 7/6/2009 01:05.
Abstract
This paper describes a prototype of the OCR math engine built in the DML-CZ project. Solution stands on the combination of FineReader and InftyReader programmes. The achieved error rate (counting not only character errors, but also errors in the recognition of structure of mathematics notation) decreased from an initial 12\% to under 1\%.
Abstract (in Czech)
Článek popisuje prototyp řešení OCR matematických textů vztvořený pro skenovaná data projektu DML CZ. Řešení spočívá v kombinaci programů FineReader a InftyReader. Dosažená chybovost (počítave nejen překlepy, ale i chyby rozpoznání matematických formulí a tzpů písem) klesla z úvodních 12% pod 1%.
Links
1ET100300419, research and development projectName: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Academy of Sciences of the Czech Republic, Information society (National programme of research)
1ET200190513, research and development projectName: DML-CZ: Česká digitální matematická knihovna
Investor: Academy of Sciences of the Czech Republic, Information society (National programme of research)
PrintDisplayed: 4/6/2020 04:20