Z 2008

DML-CZ OCR of mathematical texts

SOJKA, Petr, Radovan PANÁK a Tomáš MUDRÁK

Základní údaje

Originální název

DML-CZ OCR of mathematical texts

Název česky

DML-CZ OCR matematických textů

Autoři

SOJKA, Petr (203 Česká republika, garant), Radovan PANÁK (703 Slovensko) a Tomáš MUDRÁK (203 Česká republika)

Vydání

2008

Další údaje

Jazyk

angličtina

Typ výsledku

Poloprovoz, ověřená technologie, odrůda, plemeno

Obor

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/08:00024487

Organizační jednotka

Fakulta informatiky

Klíčová slova anglicky

OCR; Optical Character Recognition; DML-CZ; digitization; Digital mathematics library project; ABBYY FineReader; FineReader SDK; InftyReader

Technické parametry

Less than 1% character error rate achieved counting all types of error (character, typographic,...)

Příznaky

Mezinárodní význam
Změněno: 22. 6. 2009 12:19, doc. RNDr. Petr Sojka, Ph.D.

Anotace

V originále

OCR technology for matematical texts, based on Finereader 8 SDK a InftyReader. Per paragraph optimized language recognition increases significantly recognition rate in two-pass process, followed by Inftyreader math recognition. [1] Radovan Panák, "Digitalizácia matematických textov", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [2] Tomáš Mudrák, "Digitalizace matematických textů", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [3] Sojka, Petr. Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts. In Štuller, Julius - Linková, Zdenka. Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu. první. Praha : Üstav informatiky AV ČR, 2006. od s. 110-113, 4 s. ISBN 80-903298-7-X.

Česky

Technologie pro OCR matematických textů, založená na Finereader 8 SDK a InftyReader, provádějící rozpoznávání textů ve dvou průchodech FineReaderu s optimalizací pro jazyky daného odstavce. [1] Radovan Panák, "Digitalizácia matematických textov", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [2] Tomáš Mudrák, "Digitalizace matematických textů", duben 2006, diplomová práce Fakulty informatiky, Masarykova univerzita (školitel Petr Sojka) [3] Sojka, Petr. Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts. In Štuller, Julius - Linková, Zdenka. Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu. první. Praha : Üstav informatiky AV ČR, 2006. od s. 110-113, 4 s. ISBN 80-903298-7-X.

Návaznosti

1ET200190513, projekt VaV
Název: DML-CZ: Česká digitální matematická knihovna
Investor: Akademie věd ČR, DML-CZ: Česká digitální matematická knihovna