RŮŽIČKA, Michal, Petr SOJKA a Vlastimil KREJČÍŘ. Towards Machine-Actionable Modules of a Digital Mathematics Library: The Example of DML-CZ. In J. Carette et al.. CICM 2013, LNAI 7961. Berlin / Heidelberg: Springer, 2013. s. 263-277, 15 s. ISBN 978-3-642-39319-8. doi:10.1007/978-3-642-39320-4_17.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Towards Machine-Actionable Modules of a Digital Mathematics Library: The Example of DML-CZ
Autoři RŮŽIČKA, Michal (203 Česká republika, garant, domácí), Petr SOJKA (203 Česká republika, domácí) a Vlastimil KREJČÍŘ (203 Česká republika, domácí).
Vydání Berlin / Heidelberg, CICM 2013, LNAI 7961, od s. 263-277, 15 s. 2013.
Nakladatel Springer
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW conference web preprint PDF SpringerLink
Impakt faktor Impact factor: 0.402 v roce 2005
Kód RIV RIV/00216224:14330/13:00068438
Organizační jednotka Fakulta informatiky
ISBN 978-3-642-39319-8
ISSN 0302-9743
Doi http://dx.doi.org/10.1007/978-3-642-39320-4_17
Klíčová slova česky DML-CZ; EuDML; DOI; ParsCit; reference; validace; DSpace; OAI-PMH; TeX; LaTeX; Tralics; Infty; automatizovaná digitální knihovna; automatizace knihoven; Google Scholar; webové metriky
Klíčová slova anglicky DML-CZ; EuDML; DOI; ParsCit; references; validation; DSpace; OAI-PMH; TeX; LaTeX; Tralics; Infty; machine-actionable digital library; library automation; Google Scholar; webometrics
Štítky best3
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 28. 4. 2014 06:26.
Anotace
Publishing and archiving mathematical literature presents its own sets of problems. Reaching the goal of building global digital mathematics library (DML), smaller DMLs play an inevitable role in collecting, validating, digitizing and checking data from smaller publishers. In this paper, we overview the technical challenges of building a machine-actionable set of modules we have developed over almost a decade of evolution of the Czech Digital Mathematics Library (DML-CZ). Firstly, we survey methods of effective automated data acquisition from the content providers. Then we show OCR processing of mathematical documents and automated segmentation of plain text references for metadata enhancement and effective DOI look up. Finally we describe connection to the European Digital Mathematics Library (EuDML) project and public interfaces of DML-CZ for the best visibility and accessibility.
Anotace česky
Publikování a archivace matematické literatury představuje samostatnou kategorii problémů. K dosažení cíle vybudování globální digitální matematické knihovny hrají nepostradatelnou roli malé digitální knihovny při shromažďování, validaci, digitalizaci a kontrole dat od menších vydavatelů. V tomto článku je představen přehled technických výzev, na které jsme narazili při vývoji automatizovaných modulů v průběhu mnohaletého budování České digitální matematické knihovny (DML-CZ). Nejdříve jsou představeny metody automatického sbírání dat od vydavatelů. Dále je představen proces optického rozpoznávání znaků (OCR) ve skenech matematických dokumentů a automatizovaná segmentace textových referencí pro obohacení metadat a efektivní dohledání DOI. Nakonec popíšeme napojení na projekt Evropské digitální matematické knihovny (EuDML) a veřejná rozhraní DML-CZ pro vylepšení viditelnosti a přístupnosti.
Návaznosti
LG13010, projekt VaVNázev: Zastoupení ČR v European Research Consortium for Informatics and Mathematics (Akronym: ERCIM-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, INGO II (od projektů s počátkem řešení v roce 2011)
250503, interní kód MUNázev: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, Rámcový program pro konkurenceschopnost a inovace (CIP)
VytisknoutZobrazeno: 19. 9. 2019 19:09