ANTOL, Matej, Jaroslav OĽHA, Terézia SLANINÁKOVÁ a Vlastislav DOHNAL. Learned metric index - proposition of learned indexing for unstructured data. Information Systems. Elsevier, 2021, roč. 100, č. 101774, s. 1-12. ISSN 0306-4379. Dostupné z: https://dx.doi.org/10.1016/j.is.2021.101774.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Learned metric index - proposition of learned indexing for unstructured data
Autoři ANTOL, Matej (703 Slovensko, garant, domácí), Jaroslav OĽHA (703 Slovensko, domácí), Terézia SLANINÁKOVÁ (703 Slovensko, domácí) a Vlastislav DOHNAL (203 Česká republika, domácí).
Vydání Information Systems, Elsevier, 2021, 0306-4379.
Další údaje
Originální jazyk angličtina
Typ výsledku Článek v odborném periodiku
Obor 10200 1.2 Computer and information sciences
Stát vydavatele Nizozemské království
Utajení není předmětem státního či obchodního tajemství
WWW URL
Impakt faktor Impact factor: 3.180
Kód RIV RIV/00216224:14330/21:00118915
Organizační jednotka Fakulta informatiky
Doi http://dx.doi.org/10.1016/j.is.2021.101774
UT WoS 000649115200005
Klíčová slova anglicky Index structures;Learned index;Unstructured data;Content-based search;Metric space
Štítky AIS-Q2, approximate search, DISA, index structures, LMI, metric data, similarity search
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 28. 4. 2022 09:52.
Anotace
The main paradigm of similarity searching in metric spaces has remained mostly unchanged for decades - data objects are organized into a hierarchical structure according to their mutual distances, using representative pivots to reduce the number of distance computations needed to efficiently search the data. We propose an alternative to this paradigm, using machine learning models to replace pivots, thus posing similarity search as a classification problem, which stands in for numerous expensive distance computations. Even a relatively naive implementation of this idea is more than competitive with state-of-the-art methods in terms of speed and recall, proving the concept as viable and showing great potential for its future development.
Návaznosti
GA19-02033S, projekt VaVNázev: Vyhledávání, analytika a anotace datových toků lidských pohybů
Investor: Grantová agentura ČR, Searching, Mining, and Annotating Human Motion Streams
LM2018140, projekt VaVNázev: e-Infrastruktura CZ (Akronym: e-INFRA CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, e-Infrastruktura CZ
MUNI/A/1549/2020, interní kód MUNázev: Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 21 (Akronym: SKOMU)
Investor: Masarykova univerzita, Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 21
MUNI/A/1573/2020, interní kód MUNázev: Aplikovaný výzkum: vyhledávání, analýza a vizualizace rozsáhlých dat, zpracování přirozeného jazyka, umělá inteligence pro analýzu biomedicínských obrazů.
Investor: Masarykova univerzita, Aplikovaný výzkum: vyhledávání, analýza a vizualizace rozsáhlých dat, zpracování přirozeného jazyka, umělá inteligence pro analýzu biomedicínských obrazů.
VytisknoutZobrazeno: 14. 5. 2024 01:25