Detailed Information on Publication Record
2008
DML-CZ OCR of mathematical texts
SOJKA, Petr, Radovan PANÁK and Tomáš MUDRÁKBasic information
Original name
DML-CZ OCR of mathematical texts
Name in Czech
DML-CZ OCR matematických textů
Authors
SOJKA, Petr (203 Czech Republic, guarantor), Radovan PANÁK (703 Slovakia) and Tomáš MUDRÁK (203 Czech Republic)
Edition
2008
Other information
Language
English
Type of outcome
Poloprovoz, ověřená technologie, odrůda, plemeno
Field of Study
20200 2.2 Electrical engineering, Electronic engineering, Information engineering
Country of publisher
Czech Republic
Confidentiality degree
není předmětem státního či obchodního tajemství
References:
RIV identification code
RIV/00216224:14330/08:00024487
Organization unit
Faculty of Informatics
Keywords in English
OCR; Optical Character Recognition; DML-CZ; digitization; Digital mathematics library project; ABBYY FineReader; FineReader SDK; InftyReader
Technical parameters
Less than 1% character error rate achieved counting all types of error (character, typographic,...)
Tags
Tags
International impact
Změněno: 22/6/2009 12:19, doc. RNDr. Petr Sojka, Ph.D.
V originále
OCR technology for matematical texts, based on Finereader 8 SDK a InftyReader. Per paragraph optimized language recognition increases significantly recognition rate in two-pass process, followed by Inftyreader math recognition. [1] Radovan Panák, "Digitalizácia matematických textov", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [2] Tomáš Mudrák, "Digitalizace matematických textů", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [3] Sojka, Petr. Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts. In Štuller, Julius - Linková, Zdenka. Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu. první. Praha : Üstav informatiky AV ČR, 2006. od s. 110-113, 4 s. ISBN 80-903298-7-X.
In Czech
Technologie pro OCR matematických textů, založená na Finereader 8 SDK a InftyReader, provádějící rozpoznávání textů ve dvou průchodech FineReaderu s optimalizací pro jazyky daného odstavce. [1] Radovan Panák, "Digitalizácia matematických textov", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [2] Tomáš Mudrák, "Digitalizace matematických textů", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [3] Sojka, Petr. Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts. In Štuller, Julius - Linková, Zdenka. Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu. první. Praha : Üstav informatiky AV ČR, 2006. od s. 110-113, 4 s. ISBN 80-903298-7-X.
Links
1ET200190513, research and development project |
|