SOJKA, Petr. Digitization Workflow in the Czech Digital Mathematics Library. In Ruyong Feng, Wen-shin Lee, Yosuke Sato. Computer Mathematics. Berlin, Heidelberg: Springer Berlin Heidelberg. s. 147-156. ISBN 978-3-662-43798-8. doi:10.1007/978-3-662-43799-5_13. 2014.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Digitization Workflow in the Czech Digital Mathematics Library
Název česky Technologie digitalizace České digitální matematické knihovny
Autoři SOJKA, Petr (203 Česká republika, garant, domácí).
Vydání Berlin, Heidelberg, Computer Mathematics, od s. 147-156, 10 s. 2014.
Nakladatel Springer Berlin Heidelberg
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 20200 2.2 Electrical engineering, Electronic engineering, Information engineering
Stát vydavatele Německo
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW DOI preprint
Kód RIV RIV/00216224:14330/14:00073362
Organizační jednotka Fakulta informatiky
ISBN 978-3-662-43798-8
Doi http://dx.doi.org/10.1007/978-3-662-43799-5_13
Klíčová slova česky DML-CZ; digitizační workflow; česká matematická literatura; projekt digitální matematické knihovny; skenování; MathML; vyhledávání matematiky; metadata; metadatový editor; FineReader
Klíčová slova anglicky DML-CZ; digitisation workflow; Czech mathematical literature; Digital mathematics library project; scanning; MathML; math retrieval; metadata; metadata editor; FineReader
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Změněno: 28. 4. 2015 22:28.
Anotace
Experience in setting up a workflow from scanned images of mathematical writings into a fully fledged mathematical library is described on the example of the project Czech Digital Mathematics Library DML-CZ http://dml.cz. An overview of the whole process is given, with detailed description of production steps involving scanned image processing and optical character recognition. Experience gained, lessons learned and tools prepared during development of DML-CZ are described. DML-CZ now serves over 30,000 articles (300,000 digitised pages) to the public.
Anotace česky
V článku sumarizujeme zkušenosti z vývoje digitalizačního procesu (od naskenovaných obrázků stránek až po plnotextovou digitální knihovnu) projektu České digitální matematické knihovny DML-CZ http://dml.cz . Je podán přehled celého procesu, spolu s detailnějším popisem kroků zpracovávajících skenované bitmapy a OCR matematického textu. Upozorňujeme na možná úskalí a problémy, s nimiž jsme se při práci na DML-CZ (300000 volně zveřejněných stránek) potýkali.
Návaznosti
LA09016, projekt VaVNázev: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Akronym: ERCIM)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Účast ČR v European Research Consortium for Informatics and Mathematics
1ET200190513, projekt VaVNázev: DML-CZ: Česká digitální matematická knihovna
Investor: Akademie věd ČR, DML-CZ: Česká digitální matematická knihovna
2C06009, projekt VaVNázev: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce
VytisknoutZobrazeno: 16. 4. 2024 23:50