D 2003

Similarity Join in Metric Spaces

DOHNAL, Vlastislav, Claudio GENNARO, Pasquale SAVINO a Pavel ZEZULA

Základní údaje

Originální název

Similarity Join in Metric Spaces

Název česky

Podobnostní spojení v metrických prostorech

Autoři

DOHNAL, Vlastislav (203 Česká republika, domácí), Claudio GENNARO (380 Itálie), Pasquale SAVINO (380 Itálie) a Pavel ZEZULA (203 Česká republika, garant, domácí)

Vydání

LNCS 2633. Berlin, Proceedings of the European Conference on Information Retrieval Research, od s. 452-467, 16 s. 2003

Nakladatel

Springer-Verlag

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

20206 Computer hardware and architecture

Stát vydavatele

Itálie

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14330/03:00008670

Organizační jednotka

Fakulta informatiky

ISBN

3-540-01274-5

UT WoS

000184816000032

Klíčová slova anglicky

similarity join; index structures; performance; text management

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 12. 12. 2022 12:59, doc. RNDr. Vlastislav Dohnal, Ph.D.

Anotace

V originále

Similarity join in distance spaces constrained by the metric postulates is the necessary complement of more famous similarity range and the nearest neighbors search primitives. However, the quadratic computational complexity of similarity joins prevents from applications on large data collections. We first study the underlying principles of such joins and suggest three categories of implementation strategies based on filtering, partitioning, or similarity range searching. Then we study an application of the D-index to implement the most promising alternative of range searching. Though also this approach is not able to eliminate the intrinsic quadratic complexity of similarity joins, significant performance improvements are confirmed by experiments.

Česky

Článek se zabývá problematikou podobnostního spojení, které je doplňkem ke známějším rozsahovým dotazům a dotazům na nejbližší sousedy. Navrhujeme tři kategorie algoritmů pro vyhodnocování podobnostních spojení a studujeme možnosti využití indexové struktury D-Index.

Návaznosti

MSM 143300004, záměr
Název: Digitální knihovny
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Digitální knihovny