2007
Classification of Multilingual Mathematical Papers in DML-CZ
SOJKA, Petr a Radim ŘEHŮŘEKZákladní údaje
Originální název
Classification of Multilingual Mathematical Papers in DML-CZ
Název česky
Klasifikace vícejazyčných matematických článků v DML-CZ
Autoři
SOJKA, Petr (203 Česká republika, garant) a Radim ŘEHŮŘEK (203 Česká republika)
Vydání
první. Brno, Proceedings of First Workshop of Recent Advances in Slavonic Natural Language Processing RASLAN 2007, od s. 89-96, 8 s. 2007
Nakladatel
Masarykova univerzita
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Kód RIV
RIV/00216224:14330/07:00019524
Organizační jednotka
Fakulta informatiky
ISBN
978-80-210-4471-5
UT WoS
000268015500011
Klíčová slova anglicky
machine learning; classification;
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 14. 1. 2008 16:23, doc. RNDr. Petr Sojka, Ph.D.
V originále
The growth of digital repositories of scientific documents is speed-ed up by various digitisation activities. Almost all papers of mathematical journals are reviewed by either Mathematical Reviews or ZentralBlatt Math, summing up to more than 2.000.000 entries. In the paper we discuss possibilities and experiments we did on the data of Czech Digital Mathematics Library, DML-CZ with the goal of developing novel scalable methods of document classification and retrieval of multilingual mathematical papers.
Česky
Nárůst velikosti digitálních repozitářů je urychlován množstvím digitalizačních projektů. Jen recenzované matematické publikace v Mathematical Reviews či ZentralBlatt Math obsahují více než 2000000 položek. V článku diskutujeme možnosti a experimenty, které jsme na datem Digitální matematické knihovny DML-CZ provedli s cílem vyvinout přesné metody klasifikace matematických textů a jejich vyhledávání.
Návaznosti
1ET200190513, projekt VaV |
| ||
1ET208050401, projekt VaV |
|