2010
Association Analyzer Implementation: State of the Art: Deliverable 8.1 of project EuDML
LEE, Mark, Petr SOJKA, Volker SORGE, Josef BAKER, Wojtek HURY et. al.Základní údaje
Originální název
Association Analyzer Implementation: State of the Art: Deliverable 8.1 of project EuDML
Autoři
LEE, Mark (826 Velká Británie a Severní Irsko), Petr SOJKA (203 Česká republika, garant, domácí), Volker SORGE (826 Velká Británie a Severní Irsko), Josef BAKER (826 Velká Británie a Severní Irsko), Wojtek HURY (616 Polsko) a Łukasz BOLIKOWSKI (616 Polsko)
Vydání
1 as of 27th November 2010. 22 s. Deliverable D8.1, 2010
Nakladatel
EU CIP-ICT-PSP project 250503 EuDML: The European Digital Mathematics Library
Další údaje
Jazyk
angličtina
Typ výsledku
Účelové publikace
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Velká Británie a Severní Irsko
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Kód RIV
RIV/00216224:14330/10:00062172
Organizační jednotka
Fakulta informatiky
Klíčová slova anglicky
The European Digital Mathematics Library; EuDML; gensim; citation linking; crossref; citation matching; document clustering; identity discovery
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 5. 12. 2012 18:15, doc. RNDr. Petr Sojka, Ph.D.
Anotace
V originále
This report focuses on two key technologies: Citation Indexing and Document Clustering. Citation Indexing concerns the automatic parsing and linking of citations to create a network of documents within the collection. This technology is well established in digital libraries and searchable archives such as CiteSeerX, Google Scholar, general projects as DRIVER, and mathematical specific digital libraries such as NUMDAM, DML-CZ or referative databases Zentralblatt MATH and Mathematical Reviews. Document Classification and Clustering are also established technologies within Information Retrieval but have not to date been widely used within digital libraries. In particular, there is very little previous work applying classification and clustering techniques to mathematical documents. However, initial research appears promising and we believe that the addition of these technologies will allow facilities beyond the current state of the art.
Návaznosti
250503, interní kód MU |
|