SOJKA, Petr. Digitisation Workflow in the Czech Digital Mathematics Library. Math-for-Industry. Kyushu, Japan: Faculty of Mathematics,Kyushu University, 2009, vol. 2009, No 22, p. 272-280. ISSN 1881-4042.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Digitisation Workflow in the Czech Digital Mathematics Library
Name in Czech Technologie digitalizace České digitální matematické knihovny
Authors SOJKA, Petr (203 Czech Republic, guarantor, belonging to the institution).
Edition Math-for-Industry, Kyushu, Japan, Faculty of Mathematics,Kyushu University, 2009, 1881-4042.
Other information
Original language English
Type of outcome Article in a journal
Field of Study 10201 Computer sciences, information science, bioinformatics
Country of publisher Japan
Confidentiality degree is not subject to a state or trade secret
WWW conference web of publisher preprint
RIV identification code RIV/00216224:14330/09:00028732
Organization unit Faculty of Informatics
Keywords (in Czech) DML-CZ; digitizační workflow; česká matematická literatura; projekt digitální matematické knihovny; skenování; MathML; vyhledávání matematiky; metadata; metadatový editor; FineReader
Keywords in English DML-CZ; digitisation workflow; Czech mathematical literature; Digital mathematics library project; scanning; MathML; math retrieval; metadata; metadata editor; FineReader
Tags International impact, Reviewed
Changed by Changed by: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Changed: 25/9/2012 16:02.
Abstract
Experience in setting up a workflow from scanned images of mathematical writings into a fully fledged mathematical library is described on the example of the project Czech Digital Mathematics Library DML-CZ http://dml.cz. An overview of the whole process is given, with detailed description of production steps involving scanned image processing and optical character recognition. Experience gained, lessons learned and tools prepared during development of DML-CZ are described. DML-CZ now serves over 25,600 articles (275,000 digitised pages) to the public.
Abstract (in Czech)
V článku sumarizujeme zkušenosti z vývoje digitalizačního procesu (od naskenovaných obrázků stránek až po plnotextovou digitální knihovnu) projektu České digitální matematické knihovny DML-CZ http://dml.cz . Je podán přehled celého procesu, spolu s detailnějším popisem kroků zpracovávajících skenované bitmapy a OCR matematického textu. Upozorňujeme na možná úskalí a problémy, s nimiž jsme se při práci na DML-CZ (275000 volně zveřejněných stránek) potýkali.
Links
1ET200190513, research and development projectName: DML-CZ: Česká digitální matematická knihovna
Investor: Academy of Sciences of the Czech Republic, DML-CZ: Czech Digital Mathematical Library
2C06009, research and development projectName: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing)
Investor: Ministry of Education, Youth and Sports of the CR
PrintDisplayed: 21/5/2024 05:32