D
2012
JBIG2 Supported by OCR
HATLAPATKA, Radim
Základní údaje
Originální název
JBIG2 Supported by OCR
Název česky
JBIG2 s podporou OCR
Autoři
HATLAPATKA, Radim (203 Česká republika, garant, domácí)
Vydání
Aachen, CEUR Workshop Proceedings, Volume 921, od s. 82-90, 9 s. 2012
Další údaje
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Kód RIV
RIV/00216224:14330/12:00067428
Organizační jednotka
Fakulta informatiky
Klíčová slova česky
jbig2enc; JBIG2; optimalizace PDF; komprese; DML; OCR; pdfJbIm; DML-CZ; EuDML
Klíčová slova anglicky
jbig2enc; JBIG2; PDF size optimization; compression; DML; OCR; pdfJbIm; DML-CZ; EuDML
Štítky
bitmap,
compression,
compression ratio,
DML,
DML-CZ,
EuDML,
JBIG2,
jbig2enc,
lossiness,
OCR,
PDF,
PDF size optimization,
pdfJbIm
Příznaky
Mezinárodní význam, Recenzováno
V originále
Digital Mathematical libraries contain a large volume of PDF documents containing scanned text. In this paper, we describe how this documents can be compressed and thus provide them more effectively to the users. We introduce a JBIG2 standard for compressing bitonal images such as scanned text and we discuss issues if OCR is used for improving the compression ratio of jbig2enc open-source encoder. For this purpose, we have designed API for using OCR in jbig2enc which we describe in this paper together with already achieved results.
Česky
Digitální matematické knihovnz obsahují velké množství PDF dokumentů obsahujících skenovaný text. V tomto článku popisujeme, jakým způsobem mohou být takové dokumenty komprimovány, a tím pádem poskytovány uživateli efektivnější cestou. Za tímto účelem představujeme JBIG2 standard pro kompresi bitonálních obrázků (např. naskenovaný text) a diskutujeme přínosy a problémy použití OCR za účelem zvýšení komprese volně šiřitelného jbig2enc enkodéru. Za tímto účelem jsme navrhli a implementovali rozhraní pro používání OCR v jbig2enc enkodéru, které zde popisujeme spolu s předběžnými výsledky.
Návaznosti
LA09016, projekt VaV | Název: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Akronym: ERCIM) | Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Účast ČR v European Research Consortium for Informatics and Mathematics |
|
250503, interní kód MU | Název: The European Digital Mathematics Library (Akronym: EuDML) | Investor: Evropská unie, The European Digital Mathematics Library |
|
Zobrazeno: 9. 11. 2024 03:03