Z 2009

Similarity and Classification of Mathematical Papers

SOJKA, Petr and Radim ŘEHŮŘEK

Basic information

Original name

Similarity and Classification of Mathematical Papers

Name in Czech

Podobnost a klasifikace matematických článků

Authors

SOJKA, Petr (203 Czech Republic, guarantor) and Radim ŘEHŮŘEK (203 Czech Republic)

Edition

2009

Other information

Language

English

Type of outcome

Poloprovoz, ověřená technologie, odrůda, plemeno

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

RIV identification code

RIV/00216224:14330/09:00028511

Organization unit

Faculty of Informatics

Keywords (in Czech)

podobnost;klasifikace;SVM;MSC;kategorizace;vizualizace

Keywords in English

similarity;classification;SVM;MSC;categorization;visualization

Technical parameters

Robust scalable technology for similarity and classification of mathematical papers

Tags

International impact, Reviewed
Změněno: 31/3/2010 22:37, doc. RNDr. Petr Sojka, Ph.D.

Abstract

V originále

Robust and scalable technology that allows, based on the full texts of mathematical papers, by machine learning methods (SVM, TFIDF, ...) to learn - top-level MSC classifier - to compute semantic similarity of mathematical papers in a digital library Reference: [1] Řehůřek, Radim - Sojka, Petr. Automated Classification and Categorization of Mathematical Knowledge. In Intelligent Computer Mathematics: AISC/Calculemus/MKM LNAI 5144. Berlin, Heidelberg, New York : Springer-Verlag, 2008. od s. 543-557, 15 s. ISBN 978-3-540--85109-7. [2] Sojka, Petr - Řehůřek, Radim. Classification of Multilingual Mathematical Papers in DML-CZ. In Proceedings of First Workshop of Recent Advances in Slavonic Natural Language Processing RASLAN 2007. první. Brno: Masarykova univerzita, 2007. od s. 89-96, 8 s. ISBN 978-80-210-4471-5.

In Czech

Robustní a škálovatelné technologie umožňující na základě plných textů článků metodami strojového učení (SVM, TFIDF, ...) naučit - top-level MSC klasifikátor - počítat sémantickou podobnost matematických článků Reference: [1] Řehůřek, Radim - Sojka, Petr. Automated Classification and Categorization of Mathematical Knowledge. In Intelligent Computer Mathematics: AISC/Calculemus/MKM LNAI 5144. Berlin, Heidelberg, New York : Springer-Verlag, 2008. od s. 543-557, 15 s. ISBN 978-3-540--85109-7. [2] Sojka, Petr - Řehůřek, Radim. Classification of Multilingual Mathematical Papers in DML-CZ. In Proceedings of First Workshop of Recent Advances in Slavonic Natural Language Processing RASLAN 2007. první. Brno: Masarykova univerzita, 2007. od s. 89-96, 8 s. ISBN 978-80-210-4471-5.

Links

1ET200190513, research and development project
Name: DML-CZ: Česká digitální matematická knihovna
Investor: Academy of Sciences of the Czech Republic, DML-CZ: Czech Digital Mathematical Library