a 2016

Math-Aware Search Interfaces for Digital Mathematical Libraries (DML)

SOJKA, Petr a Michal RŮŽIČKA

Základní údaje

Originální název

Math-Aware Search Interfaces for Digital Mathematical Libraries (DML)

Autoři

SOJKA, Petr (203 Česká republika, garant, domácí) a Michal RŮŽIČKA (203 Česká republika, domácí)

Vydání

2016

Další údaje

Jazyk

angličtina

Typ výsledku

Konferenční abstrakt

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Spojené státy

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/16:00089346

Organizační jednotka

Fakulta informatiky

Klíčová slova anglicky

EuDML; maths information retrieval; digital libraries; search engine; MIaS; WebMIaS; MSC; gensim; LDA

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 16. 11. 2016 01:15, doc. RNDr. Petr Sojka, Ph.D.

Anotace

V originále

Search is an ubiquitous way of access to digital knowledge today and math is no exception. Re-searching using online digital libraries like arXiv.org or the European Digital Mathematics Library (EuDML, http://eudml.org/) needs specific tools allowing math-aware similarity search or formulae search in addition to the widespread textual keyword queries. We will reflect on the implementation and experience with two search modules that take into account math specifics: (i) advanced search supporting mathematical formulae in addition to text keyword queries and (ii) semantic similarity search. Similarity search allows to find semantically similar papers (using distributional semantics methods such as LDA or word vectors) to a given one to allow math-aware browsing. Experiments taking into account formulae for topic (MSC) representation will be discussed. Both modules have been deployed by the EuDML for more than 2 years now. We will share experience with their use scenarios. We will also discuss suitable web interfaces to access the DML, and their acceptance by the community.

Návaznosti

MUNI/A/0892/2015, interní kód MU
Název: Výzkum v aplikované informatice na FI MU (Akronym: VAIFIMU)
Investor: Masarykova univerzita, Výzkum v aplikované informatice na FI MU, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
250503, interní kód MU
Název: The European Digital Mathematics Library (Akronym: EuDML)
Investor: Evropská unie, The European Digital Mathematics Library