D
2008
Automated Classification and Categorization of Mathematical Knowledge
ŘEHŮŘEK, Radim a Petr SOJKA
Základní údaje
Originální název
Automated Classification and Categorization of Mathematical Knowledge
Název česky
Automatická klasifikace a kategorizace matematiky
Autoři
ŘEHŮŘEK, Radim (203 Česká republika) a
Petr SOJKA (203 Česká republika, garant)
Vydání
první. Berlin, Heidelberg, New York, Intelligent Computer Mathematics: AISC/Calculemus/MKM LNAI 5144, od s. 543-557, 15 s. 2008
Nakladatel
Springer-Verlag
Další údaje
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Velká Británie a Severní Irsko
Utajení
není předmětem státního či obchodního tajemství
Impakt faktor
Impact factor: 0.402 v roce 2005
Kód RIV
RIV/00216224:14330/08:00024245
Organizační jednotka
Fakulta informatiky
Klíčová slova česky
strojové učení; klasifikace; kategorizace; podobnost matematických dokumentů; správa matematických znalostí
Klíčová slova anglicky
machine learning; classification; categorization; similarity of mathematical papers; mathematical knowledge management; MSC;mathematical subject classification
Příznaky
Mezinárodní význam, Recenzováno
V originále
There is a common Mathematics Subject Classification (MSC) System used for categorizing mathematical papers and knowledge. We present results of machine learning of the MSC on full texts of papers in the mathematical digital libraries DML-CZ and NUMDAM. The F1-measure achieved on classification task of top-level MSC categories exceeds 89%. We describe and evaluate our methods for measuring the similarity. of papers in the digital library based on paper full texts.
Česky
Existuje široce používaný systém Mathematics Subject Classification (MSC) pro kategorizaci a vyhledávání matematických článků a textů. Preyentujeme výsledky strojového učení MSC z článků digitálních knihoven DML-CZ a NUMDAM. Míra F1 získaná při vyhodnocení klasifikace hlavních MSC kategorií přesahuje 89%. Popisujeme a vyhodnocujeme naše metody pro měření podobnosti.
Návaznosti
LC536, projekt VaV | Název: Centrum komputační lingvistiky | Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky |
|
1ET200190513, projekt VaV | Název: DML-CZ: Česká digitální matematická knihovna | Investor: Akademie věd ČR, DML-CZ: Česká digitální matematická knihovna |
|
1ET208050401, projekt VaV | Název: E-learning v kontextu sémantického webu | Investor: Akademie věd ČR, E-learning v kontextu sémantického webu |
|
2C06009, projekt VaV | Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing) | Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce |
|
Zobrazeno: 9. 11. 2024 01:55