u 2010

Association Analyzer Implementation: State of the Art: Deliverable 8.1 of project EuDML

LEE, Mark, Petr SOJKA, Volker SORGE, Josef BAKER, Wojtek HURY et. al.

Základní údaje

Originální název

Association Analyzer Implementation: State of the Art: Deliverable 8.1 of project EuDML

Autoři

LEE, Mark (826 Velká Británie a Severní Irsko), Petr SOJKA (203 Česká republika, garant, domácí), Volker SORGE (826 Velká Británie a Severní Irsko), Josef BAKER (826 Velká Británie a Severní Irsko), Wojtek HURY (616 Polsko) a Łukasz BOLIKOWSKI (616 Polsko)

Vydání

1 as of 27th November 2010. 22 s. Deliverable D8.1, 2010

Nakladatel

EU CIP-ICT-PSP project 250503 EuDML: The European Digital Mathematics Library

Další údaje

Jazyk

angličtina

Typ výsledku

Účelové publikace

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Velká Británie a Severní Irsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/10:00062172

Organizační jednotka

Fakulta informatiky

Klíčová slova anglicky

The European Digital Mathematics Library; EuDML; gensim; citation linking; crossref; citation matching; document clustering; identity discovery

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 5. 12. 2012 18:15, doc. RNDr. Petr Sojka, Ph.D.

Anotace

V originále

This report focuses on two key technologies: Citation Indexing and Document Clustering. Citation Indexing concerns the automatic parsing and linking of citations to create a network of documents within the collection. This technology is well established in digital libraries and searchable archives such as CiteSeerX, Google Scholar, general projects as DRIVER, and mathematical specific digital libraries such as NUMDAM, DML-CZ or referative databases Zentralblatt MATH and Mathematical Reviews. Document Classification and Clustering are also established technologies within Information Retrieval but have not to date been widely used within digital libraries. In particular, there is very little previous work applying classification and clustering techniques to mathematical documents. However, initial research appears promising and we believe that the addition of these technologies will allow facilities beyond the current state of the art.

Návaznosti

250503, interní kód MU
Název: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library