SOJKA, Petr. Why TeX math search is more relevant now than ever (invited talk 21.5.2012,Portsmouth University Computing Seminar,UK). Online. In University of Portsmouth Computing Seminar. 2012, [citováno 2024-04-23]
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Why TeX math search is more relevant now than ever (invited talk 21.5.2012,Portsmouth University Computing Seminar,UK)
Název česky Proč je TeXové hledání matematiky dnes důležitější než dříve (zvaná přednáška 21.5.2012,Portsmouth University Computing Seminar,Portsmouth,UK)
Autoři SOJKA, Petr (203 Česká republika, garant, domácí)
Vydání University of Portsmouth Computing Seminar, 2012.
Další údaje
Originální jazyk angličtina
Typ výsledku Vyžádané přednášky
Obor 10101 Pure mathematics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
WWW slides
Kód RIV RIV/00216224:14330/12:00060008
Organizační jednotka Fakulta informatiky
Klíčová slova česky vyhledávání matematických formulí; TeX;DML-CZ;workflow digitalizace;digitalni knihovny;pdfjbim;jbig2enc;RDF recompression
Klíčová slova anglicky math-aware search;mathematics knowledge management;TeX;DML-CZ;digitization workflow;digital libraries;pdfJbim;big2enc;PDF recompression
Příznaky Mezinárodní význam
Změnil Změnil: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Změněno: 12. 9. 2012 14:37.
Anotace
TeX is around 30 years old, and was conceived and written before the advent of MathML, not to mention the Internet. At that time the idea of indexing and searching mathematics was just a futuristic idea. When people jumped on the Google bandwagon, it was predicted that old technologies such as TEX mark-up for math would disappear in time (it is not used for tokenization and indexing properly). The advent of the Internet and W3C brought mark-up and global search to the attention of the public. Somehow it was acceptable again. The recent move to the semantic search and MathML has brought renewed attention to the need of unambiguous canonical math representation in texts. As part of the project of building the European Digital Mathematics Library (http://www.eudml.eu) we have designed and implemented a math search engine, MIaS (http://nlp.fi.muni.cz/projekty/eudml/mias). It currently indexes and searches more than 160,000,000 formulae originally written by authors in TeX in their scientific papers. We will present the system and will discuss the ways towards a global math search engine based on the TeX math notation.
Návaznosti
LA09016, projekt VaVNázev: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Akronym: ERCIM)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Účast ČR v European Research Consortium for Informatics and Mathematics
250503, interní kód MUNázev: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library
VytisknoutZobrazeno: 23. 4. 2024 14:43