D 2012

Normalization of Digital Mathematics Library Content

FORMÁNEK, David, Martin LÍŠKA, Michal RŮŽIČKA and Petr SOJKA

Basic information

Original name

Normalization of Digital Mathematics Library Content

Name in Czech

Normalizace obsahu digitální matematické knihovny

Authors

FORMÁNEK, David (203 Czech Republic, belonging to the institution), Martin LÍŠKA (703 Slovakia, belonging to the institution), Michal RŮŽIČKA (203 Czech Republic, belonging to the institution) and Petr SOJKA (203 Czech Republic, guarantor, belonging to the institution)

Edition

Brno, DML 2012: Towards a Digital Mathematics Library, p. 91-103, 13 pp. 2012

Publisher

Masaryk University

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Germany

Confidentiality degree

není předmětem státního či obchodního tajemství

Publication form

printed version "print"

RIV identification code

RIV/00216224:14330/12:00107048

Organization unit

Faculty of Informatics

ISSN

Keywords (in Czech)

normalizace MathML; kanonizace; digitálním matematické knihovny; DML; presentation MathML

Keywords in English

MathML normalization; canonicalization; digital mathematics libraries; DML; presentation MathML

Tags

International impact, Reviewed
Změněno: 18/5/2018 05:46, RNDr. Pavel Šmerk, Ph.D.

Abstract

V originále

Paper discusses the needs for data normalization in a Digital Mathematics Library (DML). Specifically, emphasis is given to canonicalizing formulae encoded in Presentation MathML notation which starts to be available in several DMLs and is used by DML applications. This is a prerequisite for advanced processing – namely math enabled fulltext searching or semantic filtering and automated classification. Different sources of MathML and their specifics are described. Several use cases of possible formulae canonicalization transformations are listed and discussed in detail. Findings are finally concluded and a design of a to-be-developed canonicalization tool is outlined.

In Czech

V tomto článku je rozebrána potřeba normalizace dat v digitální matematické knihovně (DML). Zejména je kladen důraz na kanonizaci formulí zapsaných v Presentation MathML, které jsou dostupné v různých digitálních matematických knihovnách a toto značkování je užíváno různými nástroji v této oblasti užívanými. Normalizace je předpokladem pro pokročilé zpracování, jmenovitě plnotextové vyhledávání s podporou hledání matematiky nebo sémantickou filtraci a automatické třídění dokumentů. V článků jsou popsány různé zdroje, z nich může MathML zápis pocházet, a jsou popsána jejich specifika. Popsáno je také několik příkladů možných kanonizačních transformací, kterou jsou shrnuty v návrhu normalizačního nástroje, který bude vyvinut.

Links

LA09016, research and development project
Name: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Acronym: ERCIM)
Investor: Ministry of Education, Youth and Sports of the CR, Czech Republic membership in the European Research Consortium for Informatics and Mathematics
250503, interní kód MU
Name: The European Digital Mathematics Library (Acronym: EuDML)
Investor: European Union