D 2008

Automated Classification and Categorization of Mathematical Knowledge

ŘEHŮŘEK, Radim a Petr SOJKA

Základní údaje

Originální název

Automated Classification and Categorization of Mathematical Knowledge

Název česky

Automatická klasifikace a kategorizace matematiky

Autoři

ŘEHŮŘEK, Radim (203 Česká republika) a Petr SOJKA (203 Česká republika, garant)

Vydání

první. Berlin, Heidelberg, New York, Intelligent Computer Mathematics: AISC/Calculemus/MKM LNAI 5144, od s. 543-557, 15 s. 2008

Nakladatel

Springer-Verlag

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Velká Británie a Severní Irsko

Utajení

není předmětem státního či obchodního tajemství

Impakt faktor

Impact factor: 0.402 v roce 2005

Kód RIV

RIV/00216224:14330/08:00024245

Organizační jednotka

Fakulta informatiky

ISBN

978-3-540--85109-7

ISSN

UT WoS

000258392600043

Klíčová slova česky

strojové učení; klasifikace; kategorizace; podobnost matematických dokumentů; správa matematických znalostí

Klíčová slova anglicky

machine learning; classification; categorization; similarity of mathematical papers; mathematical knowledge management; MSC;mathematical subject classification

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 22. 6. 2009 13:22, doc. RNDr. Petr Sojka, Ph.D.

Anotace

V originále

There is a common Mathematics Subject Classification (MSC) System used for categorizing mathematical papers and knowledge. We present results of machine learning of the MSC on full texts of papers in the mathematical digital libraries DML-CZ and NUMDAM. The F1-measure achieved on classification task of top-level MSC categories exceeds 89%. We describe and evaluate our methods for measuring the similarity. of papers in the digital library based on paper full texts.

Česky

Existuje široce používaný systém Mathematics Subject Classification (MSC) pro kategorizaci a vyhledávání matematických článků a textů. Preyentujeme výsledky strojového učení MSC z článků digitálních knihoven DML-CZ a NUMDAM. Míra F1 získaná při vyhodnocení klasifikace hlavních MSC kategorií přesahuje 89%. Popisujeme a vyhodnocujeme naše metody pro měření podobnosti.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET200190513, projekt VaV
Název: DML-CZ: Česká digitální matematická knihovna
Investor: Akademie věd ČR, DML-CZ: Česká digitální matematická knihovna
1ET208050401, projekt VaV
Název: E-learning v kontextu sémantického webu
Investor: Akademie věd ČR, E-learning v kontextu sémantického webu
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce