M 2011

DML 2011 workshop

SOJKA, Petr and Thierry BOUCHE

Basic information

Original name

DML 2011 workshop

Name in Czech

DML 2011 workshop

Authors

SOJKA, Petr (203 Czech Republic, guarantor, belonging to the institution) and Thierry BOUCHE (250 France)

Edition

2011

Other information

Language

English

Type of outcome

Uspořádání konference

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Italy

Confidentiality degree

není předmětem státního či obchodního tajemství

RIV identification code

RIV/00216224:14330/11:00052671

Organization unit

Faculty of Informatics

Keywords (in Czech)

digitalizace;matematika;digitalizace matematiky; matematická knihovna;digitální knihovna;TeX;digitalizační nástroje;OCR;OCR matematiky;OAI-PMH

Keywords in English

digitization; mathematics; digitization of mathematics;digital mathematics library;digital library;TeX;digitization tools;OCR; maths OCR;OAI-PMH

Tags

International impact, Reviewed
Změněno: 11/7/2011 08:41, doc. RNDr. Petr Sojka, Ph.D.

Abstract

V originále

Workshop was organized as part of CICM multiconference. Topics included: * search, indexing and retrieval of mathematical documents * ranking of mathematical papers, similarity of mathematical documents * math OCR with MathML/TeX output * document conversions from/to MathML, OpenMath, LaTeX, PostScript and [tagged] PDF * mathematical document compression * processing of scanned images * algorithms for crosslinking of bibliographical items, intext citations search * mathematical document classification, MSC 2010 * mathematical text mining * mathematical documents metadata exchange via OAI-PMH and/or OAI-ORE * long term archiving, data migration * reports and experience from math digitization projects * math publishing with long term archival goal * software engineering aspects of creating, handling MathML, OMDoc, OpenMath documents, and displaying them in web browsers. Proceedings was published (9 papers) by Masaryk University Press prior to the event.

In Czech

Témata konference pořádané při CICM 2010: * vyhledávání a indexace matematických dokumentů * ohodnocování a podobnost mat. dokumentů * OCR matematiky s výstupem do MathML/TeX * konverze dokumentů z/do MathML, OpenMath, LaTeX, PostScript a [tagged] PDF * komprese matematcých dokumentů * zpracování skenovaných obrázků * algoritmy pro provázání citací, vyhledávání odkazů v textu * klasifikace matematických dokumentů, MSC 2010 * dolování v matematických textech * výměna metadat matematických dokumentů přes OAI-PMH a/nebo OAI-ORE * dlouhodobá archivace a migrace dat; * zprávy a zkušenosti digitizačních projektů * publikování s cílem dlouhodobé archivace * softwarově-inženýrské aspekty vytváření a zpracování MathML, OMDoc, OpenMath dokumentů, a jejich zobrazení ve webových prohlížečích. Sborník byl publikován Masarykovou univerzitou před konferencí (9 příspěvků).

Links

LA09016, research and development project
Name: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Acronym: ERCIM)
Investor: Ministry of Education, Youth and Sports of the CR, Czech Republic membership in the European Research Consortium for Informatics and Mathematics
250503, interní kód MU
Name: The European Digital Mathematics Library (Acronym: EuDML)
Investor: European Union