DOHNAL, Vlastislav, Claudio GENNARO, Pasquale SAVINO a Pavel ZEZULA. Similarity Join in Metric Spaces. In Proceedings of the European Conference on Information Retrieval Research. LNCS 2633. Berlin: Springer-Verlag. s. 452-467. ISBN 3-540-01274-5. 2003.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Similarity Join in Metric Spaces
Název česky Podobnostní spojení v metrických prostorech
Autoři DOHNAL, Vlastislav (203 Česká republika, domácí), Claudio GENNARO (380 Itálie), Pasquale SAVINO (380 Itálie) a Pavel ZEZULA (203 Česká republika, garant, domácí).
Vydání LNCS 2633. Berlin, Proceedings of the European Conference on Information Retrieval Research, od s. 452-467, 16 s. 2003.
Nakladatel Springer-Verlag
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 20206 Computer hardware and architecture
Stát vydavatele Itálie
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
Kód RIV RIV/00216224:14330/03:00008670
Organizační jednotka Fakulta informatiky
ISBN 3-540-01274-5
UT WoS 000184816000032
Klíčová slova anglicky similarity join; index structures; performance; text management
Štítky DISA, index structures, performance, similarity join, text management
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: doc. RNDr. Vlastislav Dohnal, Ph.D., učo 2952. Změněno: 12. 12. 2022 12:59.
Anotace
Similarity join in distance spaces constrained by the metric postulates is the necessary complement of more famous similarity range and the nearest neighbors search primitives. However, the quadratic computational complexity of similarity joins prevents from applications on large data collections. We first study the underlying principles of such joins and suggest three categories of implementation strategies based on filtering, partitioning, or similarity range searching. Then we study an application of the D-index to implement the most promising alternative of range searching. Though also this approach is not able to eliminate the intrinsic quadratic complexity of similarity joins, significant performance improvements are confirmed by experiments.
Anotace česky
Článek se zabývá problematikou podobnostního spojení, které je doplňkem ke známějším rozsahovým dotazům a dotazům na nejbližší sousedy. Navrhujeme tři kategorie algoritmů pro vyhodnocování podobnostních spojení a studujeme možnosti využití indexové struktury D-Index.
Návaznosti
MSM 143300004, záměrNázev: Digitální knihovny
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Digitální knihovny
VytisknoutZobrazeno: 19. 4. 2024 13:01