J 2022

Data-dependent Metric Filtering

MÍČ, Vladimír a Pavel ZEZULA

Základní údaje

Originální název

Data-dependent Metric Filtering

Autoři

MÍČ, Vladimír (203 Česká republika, domácí) a Pavel ZEZULA (203 Česká republika, garant, domácí)

Vydání

Information systems, 2022, 0306-4379

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Nizozemské království

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Impakt faktor

Impact factor: 3.700

Kód RIV

RIV/00216224:14330/22:00125539

Organizační jednotka

Fakulta informatiky

UT WoS

001133975200010

Klíčová slova anglicky

Metric Space Searching;Similarity Search;Metric Filtering;Data Dependent Filtering

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 13. 5. 2024 16:36, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Filtering is a fundamental strategy of metric similarity indexes to minimise the number of computed distances. Given a triplet of objects for which distances of two pairs are known, the lower and upper bounds on the third distance can be determined using the triangle inequality property. Obviously, tightness of the bounds is crucial for efficiency reasons — the more precise the estimation, the more distance computations can be avoided, and the more efficient the search is. We show that it is not necessary to consider arbitrary angles in triangles formed by pairwise distances of three objects, as specific range of possible angles is data dependent. When considering realistic ranges of angles, the bounds on distances can be much more tight and filtering much more effective. We formalise the problem of the data dependent estimation of bounds on distances and deeply analyse limited angles in triangles of distances. We justify the potential of the data dependent metric filtering both, analytically and experimentally, executing many distance estimations on several real-life datasets.

Návaznosti

EF16_019/0000822, projekt VaV
Název: Centrum excelence pro kyberkriminalitu, kyberbezpečnost a ochranu kritických informačních infrastruktur