J 2021

Learned metric index - proposition of learned indexing for unstructured data

ANTOL, Matej, Jaroslav OĽHA, Terézia SLANINÁKOVÁ a Vlastislav DOHNAL

Základní údaje

Originální název

Learned metric index - proposition of learned indexing for unstructured data

Autoři

ANTOL, Matej (703 Slovensko, garant, domácí), Jaroslav OĽHA (703 Slovensko, domácí), Terézia SLANINÁKOVÁ (703 Slovensko, domácí) a Vlastislav DOHNAL (203 Česká republika, domácí)

Vydání

Information Systems, Elsevier, 2021, 0306-4379

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Nizozemské království

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Impakt faktor

Impact factor: 3.180

Kód RIV

RIV/00216224:14330/21:00118915

Organizační jednotka

Fakulta informatiky

UT WoS

000649115200005

Klíčová slova anglicky

Index structures;Learned index;Unstructured data;Content-based search;Metric space

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 28. 4. 2022 09:52, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

The main paradigm of similarity searching in metric spaces has remained mostly unchanged for decades - data objects are organized into a hierarchical structure according to their mutual distances, using representative pivots to reduce the number of distance computations needed to efficiently search the data. We propose an alternative to this paradigm, using machine learning models to replace pivots, thus posing similarity search as a classification problem, which stands in for numerous expensive distance computations. Even a relatively naive implementation of this idea is more than competitive with state-of-the-art methods in terms of speed and recall, proving the concept as viable and showing great potential for its future development.

Návaznosti

GA19-02033S, projekt VaV
Název: Vyhledávání, analytika a anotace datových toků lidských pohybů
Investor: Grantová agentura ČR, Searching, Mining, and Annotating Human Motion Streams
LM2018140, projekt VaV
Název: e-Infrastruktura CZ (Akronym: e-INFRA CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, e-Infrastruktura CZ
MUNI/A/1549/2020, interní kód MU
Název: Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 21 (Akronym: SKOMU)
Investor: Masarykova univerzita, Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 21
MUNI/A/1573/2020, interní kód MU
Název: Aplikovaný výzkum: vyhledávání, analýza a vizualizace rozsáhlých dat, zpracování přirozeného jazyka, umělá inteligence pro analýzu biomedicínských obrazů.
Investor: Masarykova univerzita, Aplikovaný výzkum: vyhledávání, analýza a vizualizace rozsáhlých dat, zpracování přirozeného jazyka, umělá inteligence pro analýzu biomedicínských obrazů.