Z 2008

DML-CZ OCR of mathematical texts

SOJKA, Petr, Radovan PANÁK and Tomáš MUDRÁK

Basic information

Original name

DML-CZ OCR of mathematical texts

Name in Czech

DML-CZ OCR matematických textů

Authors

SOJKA, Petr (203 Czech Republic, guarantor), Radovan PANÁK (703 Slovakia) and Tomáš MUDRÁK (203 Czech Republic)

Edition

2008

Other information

Language

English

Type of outcome

Poloprovoz, ověřená technologie, odrůda, plemeno

Field of Study

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

References:

RIV identification code

RIV/00216224:14330/08:00024487

Organization unit

Faculty of Informatics

Keywords in English

OCR; Optical Character Recognition; DML-CZ; digitization; Digital mathematics library project; ABBYY FineReader; FineReader SDK; InftyReader

Technical parameters

Less than 1% character error rate achieved counting all types of error (character, typographic,...)

Tags

International impact
Změněno: 22/6/2009 12:19, doc. RNDr. Petr Sojka, Ph.D.

Abstract

V originále

OCR technology for matematical texts, based on Finereader 8 SDK a InftyReader. Per paragraph optimized language recognition increases significantly recognition rate in two-pass process, followed by Inftyreader math recognition. [1] Radovan Panák, "Digitalizácia matematických textov", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [2] Tomáš Mudrák, "Digitalizace matematických textů", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [3] Sojka, Petr. Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts. In Štuller, Julius - Linková, Zdenka. Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu. první. Praha : Üstav informatiky AV ČR, 2006. od s. 110-113, 4 s. ISBN 80-903298-7-X.

In Czech

Technologie pro OCR matematických textů, založená na Finereader 8 SDK a InftyReader, provádějící rozpoznávání textů ve dvou průchodech FineReaderu s optimalizací pro jazyky daného odstavce. [1] Radovan Panák, "Digitalizácia matematických textov", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [2] Tomáš Mudrák, "Digitalizace matematických textů", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [3] Sojka, Petr. Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts. In Štuller, Julius - Linková, Zdenka. Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu. první. Praha : Üstav informatiky AV ČR, 2006. od s. 110-113, 4 s. ISBN 80-903298-7-X.

Links

1ET200190513, research and development project
Name: DML-CZ: Česká digitální matematická knihovna
Investor: Academy of Sciences of the Czech Republic, DML-CZ: Czech Digital Mathematical Library