SOJKA, Petr, Josef BAKER, Alan SEXTON a Volker SORGE. State of the Art of Augmenting Metadata Techniques and Technology: Deliverable 7.1 of project EuDML. 1.2 as of 2nd November 2010. EU CIP-ICT-PSP project 250503 EuDML: The European Digital Mathematics Library, 2010, 40 s. Deliverable D7.1.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název State of the Art of Augmenting Metadata Techniques and Technology: Deliverable 7.1 of project EuDML
Autoři SOJKA, Petr (203 Česká republika, garant, domácí), Josef BAKER (826 Velká Británie a Severní Irsko), Alan SEXTON (826 Velká Británie a Severní Irsko) a Volker SORGE (826 Velká Británie a Severní Irsko).
Vydání 1.2 as of 2nd November 2010. 40 s. Deliverable D7.1, 2010.
Nakladatel EU CIP-ICT-PSP project 250503 EuDML: The European Digital Mathematics Library
Další údaje
Originální jazyk angličtina
Typ výsledku Účelové publikace
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
WWW Fulltext
Kód RIV RIV/00216224:14330/10:00062158
Organizační jednotka Fakulta informatiky
Klíčová slova anglicky The European Digital Mathematics Library; EuDML; DML-CZ; digitisation workflow; metadata enhancements; Digital mathematics library; DML; scanning; MathML; math retrieval; metadata; metadata editor; FineReader; OCRopus; Tesseract
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnila: Mgr. Lucia Kocincová, učo 374080. Změněno: 5. 12. 2012 16:25.
Anotace
Identification of main issues and challenges on augmenting metadata techniques and technologies appropriate for using on a corpora of mathematical scientific documents. For most partial tasks tools were identified that are able to cover basic functionalities that are expected to be needed by a digital library of EuDML type, as in other projects like PubMed Central or Portico. Generic standard techniques for metadata enhancement and normalization are applicable there. Deliverable also reviews and identifies expertize and tools from some project partners (MU, CMD, ICM, FIZ, IU, and IMI-BAS). Main (unresolved) challenges posed are OCR of mathematics and reliable and robust converting between different math formats (TEX and MathML) to normalize in one primary metadata format (NLM Archiving DTD Suite) to allow services like math indexing and search. In a follow up deliverable D7.2, tools and techniques will be chosen for usage in the EuDML core engine (combining YADDA and REPOX), or as a (loosely coupled) set of enhancement tools in a linked data fashion.
Návaznosti
250503, interní kód MUNázev: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library
VytisknoutZobrazeno: 19. 9. 2024 10:47