SOJKA, Petr, Radovan PANÁK and Tomáš MUDRÁK. DML-CZ OCR of mathematical texts. 2008.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name DML-CZ OCR of mathematical texts
Name in Czech DML-CZ OCR matematických textů
Authors SOJKA, Petr (203 Czech Republic, guarantor), Radovan PANÁK (703 Slovakia) and Tomáš MUDRÁK (203 Czech Republic).
Edition 2008.
Other information
Original language English
Type of outcome Pilot plant, certified technology, variety, breed
Field of Study 20200 2.2 Electrical engineering, Electronic engineering, Information engineering
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
WWW URL
RIV identification code RIV/00216224:14330/08:00024487
Organization unit Faculty of Informatics
Keywords in English OCR; Optical Character Recognition; DML-CZ; digitization; Digital mathematics library project; ABBYY FineReader; FineReader SDK; InftyReader
Technical parameters Less than 1% character error rate achieved counting all types of error (character, typographic,...)
Tags ABBYY FineReader, Digital mathematics library project, digitization, DML-CZ, FineReader SDK, InftyReader, OCR, Optical Character Recognition
Tags International impact
Changed by Changed by: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Changed: 22/6/2009 12:19.
Abstract
OCR technology for matematical texts, based on Finereader 8 SDK a InftyReader. Per paragraph optimized language recognition increases significantly recognition rate in two-pass process, followed by Inftyreader math recognition. [1] Radovan Panák, "Digitalizácia matematických textov", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [2] Tomáš Mudrák, "Digitalizace matematických textů", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [3] Sojka, Petr. Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts. In Štuller, Julius - Linková, Zdenka. Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu. první. Praha : Üstav informatiky AV ČR, 2006. od s. 110-113, 4 s. ISBN 80-903298-7-X.
Abstract (in Czech)
Technologie pro OCR matematických textů, založená na Finereader 8 SDK a InftyReader, provádějící rozpoznávání textů ve dvou průchodech FineReaderu s optimalizací pro jazyky daného odstavce. [1] Radovan Panák, "Digitalizácia matematických textov", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [2] Tomáš Mudrák, "Digitalizace matematických textů", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [3] Sojka, Petr. Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts. In Štuller, Julius - Linková, Zdenka. Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu. první. Praha : Üstav informatiky AV ČR, 2006. od s. 110-113, 4 s. ISBN 80-903298-7-X.
Links
1ET200190513, research and development projectName: DML-CZ: Česká digitální matematická knihovna
Investor: Academy of Sciences of the Czech Republic, Information society (National programme of research)
PrintDisplayed: 3/6/2020 19:23