SOJKA, Petr. Workflow in the Digital Mathematics Library Project. In Znalosti 2006, sborník příspěvků. první. Ostrava: VŠB-TU Ostrava, 2006. p. 243-247, 4 pp. ISBN 80-248-1001-8.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Workflow in the Digital Mathematics Library Project
Name in Czech Zpracování dat české digitální matematické knihovny
Authors SOJKA, Petr (203 Czech Republic, guarantor).
Edition první. Ostrava, Znalosti 2006, sborník příspěvků, p. 243-247, 4 pp. 2006.
Publisher VŠB-TU Ostrava
Other information
Original language English
Type of outcome Proceedings paper
Field of Study 20200 2.2 Electrical engineering, Electronic engineering, Information engineering
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
WWW URL
RIV identification code RIV/00216224:14330/06:00015298
Organization unit Faculty of Informatics
ISBN 80-248-1001-8
Keywords in English digital library; metadata handling; semantics of mathematical documents; knowledge management; digitization; MathML; visualization; portal-systems; repositories of knowledge; DML-CZ
Tags digital library, digitization, DML-CZ, knowledge management, MathML, metadata handling, portal-systems, repositories of knowledge, semantics of mathematical documents, visualization
Tags International impact, Reviewed
Changed by Changed by: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Changed: 13/2/2007 23:05.
Abstract
This paper is a progress report of the retrodigitization project of the Czech Digital Mathematics Library, DML CZ. We are aiming to digitize valuable mathematical journals and books (250,000 pages) published in the Czech and Slovak Republics, and make them publicly available in digital form. We describe here the project work-flow: the key concept is a gradual enhancement of the digital material by `knowledge enhancing' filters applied to the markup-rich XML data.
Abstract (in Czech)
Článek je zprávou o řešení retrodigitalizačního projektu DML CZ. Cílem je zdigitalizovat přes čtvrt milionu stran recenzovaných článků časopisů publikovaných v ČR a SR, a jejich zpřístupnění ve vhodné digitální podobě. Je popsán navržený tok zpracovávaných dat v projektu: základní přístup je vývoj sady filtrů naskenovaných OCR dat tak, aby výsledkem byly kromě obrázků stránek bohatě značkované XML texty.
Links
1ET100300419, research and development projectName: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Academy of Sciences of the Czech Republic, Information society (National programme of research)
1ET200190513, research and development projectName: DML-CZ: Česká digitální matematická knihovna
Investor: Academy of Sciences of the Czech Republic, Information society (National programme of research)
1ET208050401, research and development projectName: E-learning v kontextu sémantického webu
Investor: Academy of Sciences of the Czech Republic, Information society (National programme of research)
PrintDisplayed: 30/5/2020 08:26