2003
Similarity Join in Metric Spaces
DOHNAL, Vlastislav, Claudio GENNARO, Pasquale SAVINO a Pavel ZEZULAZákladní údaje
Originální název
Similarity Join in Metric Spaces
Název česky
Podobnostní spojení v metrických prostorech
Autoři
DOHNAL, Vlastislav (203 Česká republika, domácí), Claudio GENNARO (380 Itálie), Pasquale SAVINO (380 Itálie) a Pavel ZEZULA (203 Česká republika, garant, domácí)
Vydání
LNCS 2633. Berlin, Proceedings of the European Conference on Information Retrieval Research, od s. 452-467, 16 s. 2003
Nakladatel
Springer-Verlag
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
20206 Computer hardware and architecture
Stát vydavatele
Itálie
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Kód RIV
RIV/00216224:14330/03:00008670
Organizační jednotka
Fakulta informatiky
ISBN
3-540-01274-5
UT WoS
000184816000032
Klíčová slova anglicky
similarity join; index structures; performance; text management
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 12. 12. 2022 12:59, doc. RNDr. Vlastislav Dohnal, Ph.D.
V originále
Similarity join in distance spaces constrained by the metric postulates is the necessary complement of more famous similarity range and the nearest neighbors search primitives. However, the quadratic computational complexity of similarity joins prevents from applications on large data collections. We first study the underlying principles of such joins and suggest three categories of implementation strategies based on filtering, partitioning, or similarity range searching. Then we study an application of the D-index to implement the most promising alternative of range searching. Though also this approach is not able to eliminate the intrinsic quadratic complexity of similarity joins, significant performance improvements are confirmed by experiments.
Česky
Článek se zabývá problematikou podobnostního spojení, které je doplňkem ke známějším rozsahovým dotazům a dotazům na nejbližší sousedy. Navrhujeme tři kategorie algoritmů pro vyhodnocování podobnostních spojení a studujeme možnosti využití indexové struktury D-Index.
Návaznosti
MSM 143300004, záměr |
|