M 2008

DML 2008 workshop

SOJKA, Petr

Basic information

Original name

DML 2008 workshop

Name in Czech

DML 2008 workshop

Authors

SOJKA, Petr (203 Czech Republic, guarantor)

Edition

2008

Other information

Language

English

Type of outcome

Uspořádání konference

Field of Study

Documentation, librarianship, work with information

Country of publisher

United Kingdom of Great Britain and Northern Ireland

Confidentiality degree

není předmětem státního či obchodního tajemství

RIV identification code

RIV/00216224:14330/08:00024232

Organization unit

Faculty of Informatics

Keywords (in Czech)

digitalizace;matematika;digitalizace matematiky; matematická knihovna;digitální knihovna;TeX;digitalizační nástroje;OCR;OCR matematiky;OAI-PMH

Keywords in English

digitization; mathematics; digitization of mathematics;digital mathematics library;digital library;TeX;digitization tools;OCR; maths OCR;OAI-PMH;

Tags

International impact, Reviewed
Změněno: 24/7/2010 18:44, doc. RNDr. Petr Sojka, Ph.D.

Abstract

V originále

Possible topics include: * search, indexing and retrieval of mathematical documents; * ranking of mathematical papers, similarity of mathematical documents; * math OCR with MathML/TeX output; * document conversions from/to MathML, OpenMath, LaTeX, PostScript and [tagged] PDF; * mathematical document compression; * processing of scanned images; * algorithms for crosslinking of bibliographical items, intext citations search; * mathematical document classification, MSC 2010; * mathematical text mining; * mathematical documents metadata exchange via OAI-PMH and/or OAI-ORE; * long term archiving, data migration; * reports and experience from math digitization projects; * math publishing with long term archival goal; * software engineering aspects of creating, handling MathML, OMDoc, OpenMath documents, and displaying them in web browsers. Conference was featured in Nature 454, 263 (2008) | doi:10.1038/454263b and proceedings was published by Masaryk University prior to the event.

In Czech

Témata konference: * vyhledávání a indexace matematických dokumentů; * ohodnocování a podobnost mat. dokumentů; * OCR matematiky s výstupem do MathML/TeX; * konverze dokumentů z/do MathML, OpenMath, LaTeX, PostScript a [tagged] PDF; * komprese matematcých dokumentů; * zpracování skenovaných obrázků; * algoritmy pro provázání citací, vyhledávání odkazů v textu; * klasifikace matematických dokumentů, MSC 2010; * dolování v matematických textech; * výměna metadat matematických dokumentů přes OAI-PMH a/nebo OAI-ORE; * dlouhodobá archivace a migrace dat; * zprávy a zkušenosti digitizačních projektů; * publikování s cílem dlouhodobé archivace; * softwarově-inženýrské aspekty vytváření a zpracování MathML, OMDoc, OpenMath dokumentů, a jejich zobrazení ve webových prohlížečích. Konferenci byl věnován článek v Nature 454, 263 (2008) | doi:10.1038/454263b a sborník byl publikován Masarykovou univerzitou před konferencí (17 příspěvků).

Links

LC536, research and development project
Name: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
1ET200190513, research and development project
Name: DML-CZ: Česká digitální matematická knihovna
Investor: Academy of Sciences of the Czech Republic, DML-CZ: Czech Digital Mathematical Library
1ET208050401, research and development project
Name: E-learning v kontextu sémantického webu
Investor: Academy of Sciences of the Czech Republic, E-learning in the Semantic Web Context