2014
Digitization Workflow in the Czech Digital Mathematics Library
SOJKA, PetrZákladní údaje
Originální název
Digitization Workflow in the Czech Digital Mathematics Library
Název česky
Technologie digitalizace České digitální matematické knihovny
Autoři
SOJKA, Petr (203 Česká republika, garant, domácí)
Vydání
Berlin, Heidelberg, Computer Mathematics, od s. 147-156, 10 s. 2014
Nakladatel
Springer Berlin Heidelberg
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
20200 2.2 Electrical engineering, Electronic engineering, Information engineering
Stát vydavatele
Německo
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Kód RIV
RIV/00216224:14330/14:00073362
Organizační jednotka
Fakulta informatiky
ISBN
978-3-662-43798-8
Klíčová slova česky
DML-CZ; digitizační workflow; česká matematická literatura; projekt digitální matematické knihovny; skenování; MathML; vyhledávání matematiky; metadata; metadatový editor; FineReader
Klíčová slova anglicky
DML-CZ; digitisation workflow; Czech mathematical literature; Digital mathematics library project; scanning; MathML; math retrieval; metadata; metadata editor; FineReader
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 28. 4. 2015 22:28, doc. RNDr. Petr Sojka, Ph.D.
V originále
Experience in setting up a workflow from scanned images of mathematical writings into a fully fledged mathematical library is described on the example of the project Czech Digital Mathematics Library DML-CZ http://dml.cz. An overview of the whole process is given, with detailed description of production steps involving scanned image processing and optical character recognition. Experience gained, lessons learned and tools prepared during development of DML-CZ are described. DML-CZ now serves over 30,000 articles (300,000 digitised pages) to the public.
Česky
V článku sumarizujeme zkušenosti z vývoje digitalizačního procesu (od naskenovaných obrázků stránek až po plnotextovou digitální knihovnu) projektu České digitální matematické knihovny DML-CZ http://dml.cz . Je podán přehled celého procesu, spolu s detailnějším popisem kroků zpracovávajících skenované bitmapy a OCR matematického textu. Upozorňujeme na možná úskalí a problémy, s nimiž jsme se při práci na DML-CZ (300000 volně zveřejněných stránek) potýkali.
Návaznosti
LA09016, projekt VaV |
| ||
1ET200190513, projekt VaV |
| ||
2C06009, projekt VaV |
|