M 2008

DML 2008 workshop

SOJKA, Petr

Základní údaje

Originální název

DML 2008 workshop

Název česky

DML 2008 workshop

Autoři

SOJKA, Petr (203 Česká republika, garant)

Vydání

2008

Další údaje

Jazyk

angličtina

Typ výsledku

Uspořádání konference

Obor

Dokumentace, knihovnictví, práce s informacemi

Stát vydavatele

Velká Británie a Severní Irsko

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/08:00024232

Organizační jednotka

Fakulta informatiky

Klíčová slova česky

digitalizace;matematika;digitalizace matematiky; matematická knihovna;digitální knihovna;TeX;digitalizační nástroje;OCR;OCR matematiky;OAI-PMH

Klíčová slova anglicky

digitization; mathematics; digitization of mathematics;digital mathematics library;digital library;TeX;digitization tools;OCR; maths OCR;OAI-PMH;

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 24. 7. 2010 18:44, doc. RNDr. Petr Sojka, Ph.D.

Anotace

V originále

Possible topics include: * search, indexing and retrieval of mathematical documents; * ranking of mathematical papers, similarity of mathematical documents; * math OCR with MathML/TeX output; * document conversions from/to MathML, OpenMath, LaTeX, PostScript and [tagged] PDF; * mathematical document compression; * processing of scanned images; * algorithms for crosslinking of bibliographical items, intext citations search; * mathematical document classification, MSC 2010; * mathematical text mining; * mathematical documents metadata exchange via OAI-PMH and/or OAI-ORE; * long term archiving, data migration; * reports and experience from math digitization projects; * math publishing with long term archival goal; * software engineering aspects of creating, handling MathML, OMDoc, OpenMath documents, and displaying them in web browsers. Conference was featured in Nature 454, 263 (2008) | doi:10.1038/454263b and proceedings was published by Masaryk University prior to the event.

Česky

Témata konference: * vyhledávání a indexace matematických dokumentů; * ohodnocování a podobnost mat. dokumentů; * OCR matematiky s výstupem do MathML/TeX; * konverze dokumentů z/do MathML, OpenMath, LaTeX, PostScript a [tagged] PDF; * komprese matematcých dokumentů; * zpracování skenovaných obrázků; * algoritmy pro provázání citací, vyhledávání odkazů v textu; * klasifikace matematických dokumentů, MSC 2010; * dolování v matematických textech; * výměna metadat matematických dokumentů přes OAI-PMH a/nebo OAI-ORE; * dlouhodobá archivace a migrace dat; * zprávy a zkušenosti digitizačních projektů; * publikování s cílem dlouhodobé archivace; * softwarově-inženýrské aspekty vytváření a zpracování MathML, OMDoc, OpenMath dokumentů, a jejich zobrazení ve webových prohlížečích. Konferenci byl věnován článek v Nature 454, 263 (2008) | doi:10.1038/454263b a sborník byl publikován Masarykovou univerzitou před konferencí (17 příspěvků).

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET200190513, projekt VaV
Název: DML-CZ: Česká digitální matematická knihovna
Investor: Akademie věd ČR, DML-CZ: Česká digitální matematická knihovna
1ET208050401, projekt VaV
Název: E-learning v kontextu sémantického webu
Investor: Akademie věd ČR, E-learning v kontextu sémantického webu