SLANINÁKOVÁ, Terézia, Matej ANTOL, Jaroslav OĽHA a Vlastislav DOHNAL. Data-driven Learned Metric Index: an Unsupervised Approach. In 14th International Conference on Similarity Search and Applications (SISAP 2021). Cham: Springer, 2021, s. 81-94. ISBN 978-3-030-89656-0. Dostupné z: https://dx.doi.org/10.1007/978-3-030-89657-7_7.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Data-driven Learned Metric Index: an Unsupervised Approach
Autoři SLANINÁKOVÁ, Terézia (703 Slovensko, domácí), Matej ANTOL (703 Slovensko, domácí), Jaroslav OĽHA (703 Slovensko, domácí) a Vlastislav DOHNAL (203 Česká republika, garant, domácí).
Vydání Cham, 14th International Conference on Similarity Search and Applications (SISAP 2021), od s. 81-94, 14 s. 2021.
Nakladatel Springer
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10200 1.2 Computer and information sciences
Stát vydavatele Nizozemské království
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
Impakt faktor Impact factor: 0.402 v roce 2005
Kód RIV RIV/00216224:14330/21:00119191
Organizační jednotka Fakulta informatiky
ISBN 978-3-030-89656-0
ISSN 0302-9743
Doi http://dx.doi.org/10.1007/978-3-030-89657-7_7
UT WoS 000722252200007
Klíčová slova anglicky Index structures; Learned index; Unstructured data; Content-based search; Metric space; Machine learning
Štítky DISA, firank_B, index structure, learned index, LMI, machine learning, similarity search
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 29. 4. 2022 08:12.
Anotace
Metric indexes are traditionally used for organizing unstructured or complex data to speed up similarity queries. The most widely-used indexes cluster data or divide space using hyper-planes. While searching, the mutual distances between objects and the metric properties allow for the pruning of branches with irrelevant data -- this is usually implemented by utilizing selected anchor objects called pivots. Recently, we have introduced an alternative to this approach called Lear\-ned Metric Index. In this method, a series of machine learning models substitute decisions performed on pivots -- the query evaluation is then determined by the predictions of these models. This technique relies upon a traditional metric index as a template for its own structure -- this dependence on a pre-existing index and the related overhead is the main drawback of the approach. In this paper, we propose a data-driven variant of the Learned Metric Index, which organizes the data using their descriptors directly, thus eliminating the need for a template. The proposed learned index shows significant gains in performance over its earlier version, as well as the established indexing structure M-index.
Návaznosti
GA19-02033S, projekt VaVNázev: Vyhledávání, analytika a anotace datových toků lidských pohybů
Investor: Grantová agentura ČR, Searching, Mining, and Annotating Human Motion Streams
MUNI/A/1573/2020, interní kód MUNázev: Aplikovaný výzkum: vyhledávání, analýza a vizualizace rozsáhlých dat, zpracování přirozeného jazyka, umělá inteligence pro analýzu biomedicínských obrazů.
Investor: Masarykova univerzita, Aplikovaný výzkum: vyhledávání, analýza a vizualizace rozsáhlých dat, zpracování přirozeného jazyka, umělá inteligence pro analýzu biomedicínských obrazů.
VytisknoutZobrazeno: 8. 6. 2024 22:59