ŘEHŮŘEK, Radim a Petr SOJKA. Automated Classification and Categorization of Mathematical Knowledge. In Intelligent Computer Mathematics: AISC/Calculemus/MKM LNAI 5144. první. Berlin, Heidelberg, New York: Springer-Verlag, 2008. s. 543-557, 15 s. ISBN 978-3-540--85109-7.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Automated Classification and Categorization of Mathematical Knowledge
Název česky Automatická klasifikace a kategorizace matematiky
Autoři ŘEHŮŘEK, Radim (203 Česká republika) a Petr SOJKA (203 Česká republika, garant).
Vydání první. Berlin, Heidelberg, New York, Intelligent Computer Mathematics: AISC/Calculemus/MKM LNAI 5144, od s. 543-557, 15 s. 2008.
Nakladatel Springer-Verlag
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor Computer sciences, information science, bioinformatics
Stát vydavatele Spojené království
Utajení není předmětem státního či obchodního tajemství
WWW web of conference paper preprint Springer Link ACM Portal
Impakt faktor Impact factor: 0.402 v roce 2005
Kód RIV RIV/00216224:14330/08:00024245
Organizační jednotka Fakulta informatiky
ISBN 978-3-540--85109-7
ISSN 0302-9743
UT WoS 000258392600043
Klíčová slova česky strojové učení; klasifikace; kategorizace; podobnost matematických dokumentů; správa matematických znalostí
Klíčová slova anglicky machine learning; classification; categorization; similarity of mathematical papers; mathematical knowledge management; MSC;mathematical subject classification
Štítky categorization, CLASSIFICATION, machine learning, mathematical knowledge management, mathematical subject classification, MSC, similarity of mathematical papers
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Změněno: 22. 6. 2009 13:22.
Anotace
There is a common Mathematics Subject Classification (MSC) System used for categorizing mathematical papers and knowledge. We present results of machine learning of the MSC on full texts of papers in the mathematical digital libraries DML-CZ and NUMDAM. The F1-measure achieved on classification task of top-level MSC categories exceeds 89%. We describe and evaluate our methods for measuring the similarity. of papers in the digital library based on paper full texts.
Anotace česky
Existuje široce používaný systém Mathematics Subject Classification (MSC) pro kategorizaci a vyhledávání matematických článků a textů. Preyentujeme výsledky strojového učení MSC z článků digitálních knihoven DML-CZ a NUMDAM. Míra F1 získaná při vyhodnocení klasifikace hlavních MSC kategorií přesahuje 89%. Popisujeme a vyhodnocujeme naše metody pro měření podobnosti.
Návaznosti
LC536, projekt VaVNázev: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centra základního výzkumu
1ET200190513, projekt VaVNázev: DML-CZ: Česká digitální matematická knihovna
Investor: Akademie věd ČR, Informační společnost (Národní program výzkumu)
1ET208050401, projekt VaVNázev: E-learning v kontextu sémantického webu
Investor: Akademie věd ČR, Informační společnost (Národní program výzkumu)
2C06009, projekt VaVNázev: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Informační technologie pro znalostní společnost
VytisknoutZobrazeno: 15. 9. 2019 08:26