LEE, Mark, Petr SOJKA, Volker SORGE, Josef BAKER, Wojtek HURY a Łukasz BOLIKOWSKI. Association Analyzer Implementation: State of the Art: Deliverable 8.1 of project EuDML. 1 as of 27th November 2010. EU CIP-ICT-PSP project 250503 EuDML: The European Digital Mathematics Library, 2010, 22 s. Deliverable D8.1.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Association Analyzer Implementation: State of the Art: Deliverable 8.1 of project EuDML
Autoři LEE, Mark (826 Velká Británie a Severní Irsko), Petr SOJKA (203 Česká republika, garant, domácí), Volker SORGE (826 Velká Británie a Severní Irsko), Josef BAKER (826 Velká Británie a Severní Irsko), Wojtek HURY (616 Polsko) a Łukasz BOLIKOWSKI (616 Polsko).
Vydání 1 as of 27th November 2010. 22 s. Deliverable D8.1, 2010.
Nakladatel EU CIP-ICT-PSP project 250503 EuDML: The European Digital Mathematics Library
Další údaje
Originální jazyk angličtina
Typ výsledku Účelové publikace
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Velká Británie a Severní Irsko
Utajení není předmětem státního či obchodního tajemství
WWW Fulltext
Kód RIV RIV/00216224:14330/10:00062172
Organizační jednotka Fakulta informatiky
Klíčová slova anglicky The European Digital Mathematics Library; EuDML; gensim; citation linking; crossref; citation matching; document clustering; identity discovery
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Změněno: 5. 12. 2012 18:15.
Anotace
This report focuses on two key technologies: Citation Indexing and Document Clustering. Citation Indexing concerns the automatic parsing and linking of citations to create a network of documents within the collection. This technology is well established in digital libraries and searchable archives such as CiteSeerX, Google Scholar, general projects as DRIVER, and mathematical specific digital libraries such as NUMDAM, DML-CZ or referative databases Zentralblatt MATH and Mathematical Reviews. Document Classification and Clustering are also established technologies within Information Retrieval but have not to date been widely used within digital libraries. In particular, there is very little previous work applying classification and clustering techniques to mathematical documents. However, initial research appears promising and we believe that the addition of these technologies will allow facilities beyond the current state of the art.
Návaznosti
250503, interní kód MUNázev: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library
VytisknoutZobrazeno: 14. 10. 2024 13:30