D 2021

Data-driven Learned Metric Index: an Unsupervised Approach

SLANINÁKOVÁ, Terézia; Matej ANTOL; Jaroslav OĽHA a Vlastislav DOHNAL

Základní údaje

Originální název

Data-driven Learned Metric Index: an Unsupervised Approach

Autoři

SLANINÁKOVÁ, Terézia (703 Slovensko, domácí); Matej ANTOL (703 Slovensko, domácí); Jaroslav OĽHA (703 Slovensko, domácí) a Vlastislav DOHNAL (203 Česká republika, garant, domácí)

Vydání

Cham, 14th International Conference on Similarity Search and Applications (SISAP 2021), od s. 81-94, 14 s. 2021

Nakladatel

Springer

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Nizozemské království

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Impakt faktor

Impact factor: 0.402 v roce 2005

Kód RIV

RIV/00216224:14330/21:00119191

Organizační jednotka

Fakulta informatiky

ISBN

978-3-030-89656-0

ISSN

UT WoS

000722252200007

EID Scopus

2-s2.0-85119014952

Klíčová slova anglicky

Index structures; Learned index; Unstructured data; Content-based search; Metric space; Machine learning

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 29. 4. 2022 08:12, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Metric indexes are traditionally used for organizing unstructured or complex data to speed up similarity queries. The most widely-used indexes cluster data or divide space using hyper-planes. While searching, the mutual distances between objects and the metric properties allow for the pruning of branches with irrelevant data -- this is usually implemented by utilizing selected anchor objects called pivots. Recently, we have introduced an alternative to this approach called Lear\-ned Metric Index. In this method, a series of machine learning models substitute decisions performed on pivots -- the query evaluation is then determined by the predictions of these models. This technique relies upon a traditional metric index as a template for its own structure -- this dependence on a pre-existing index and the related overhead is the main drawback of the approach. In this paper, we propose a data-driven variant of the Learned Metric Index, which organizes the data using their descriptors directly, thus eliminating the need for a template. The proposed learned index shows significant gains in performance over its earlier version, as well as the established indexing structure M-index.

Návaznosti

GA19-02033S, projekt VaV
Název: Vyhledávání, analytika a anotace datových toků lidských pohybů
Investor: Grantová agentura ČR, Searching, Mining, and Annotating Human Motion Streams
MUNI/A/1573/2020, interní kód MU
Název: Aplikovaný výzkum: vyhledávání, analýza a vizualizace rozsáhlých dat, zpracování přirozeného jazyka, umělá inteligence pro analýzu biomedicínských obrazů.
Investor: Masarykova univerzita, Aplikovaný výzkum: vyhledávání, analýza a vizualizace rozsáhlých dat, zpracování přirozeného jazyka, umělá inteligence pro analýzu biomedicínských obrazů.

Přiložené soubory

SISAP_2021___Unsupervised_Learned_Metric_Index_slaninakova.pdf
Požádat o autorskou verzi souboru