D 2004

Scalable Similarity Search in Metric Spaces

BATKO, Michal, Claudio GENNARO, Savino PASQUALE a Pavel ZEZULA

Základní údaje

Originální název

Scalable Similarity Search in Metric Spaces

Název česky

Škálovatelné podobnostní hledání v metrických prostorech

Autoři

BATKO, Michal (203 Česká republika), Claudio GENNARO (380 Itálie), Savino PASQUALE (380 Itálie) a Pavel ZEZULA (203 Česká republika, garant)

Vydání

Cagliari, Pre-proceedings of the Sixth Thematic Workshop of the EU Network of Excellence DELOS, od s. 213-224, 12 s. 2004

Nakladatel

Edizioni Progetto Padova

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

20206 Computer hardware and architecture

Stát vydavatele

Itálie

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14610/04:00010210

Organizační jednotka

Ústav výpočetní techniky

Klíčová slova anglicky

distributed data; scalable structures; similarity search; metric space

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 7. 12. 2005 10:53, RNDr. Michal Batko, Ph.D.

Anotace

V originále

Similarity search in metric spaces represents an important paradigm for content-based retrieval of many applications. Existing centralized search structures can speed-up retrieval, but they do not scale up to large volume of data because the response time is linearly increasing with the size of the searched file. The proposed GHT* index is a scalable and distributed structure. By exploiting parallelism in a dynamic network of computers, the GHT* achieves practically constant search time for similarity range queries in data-sets of arbitrary size. The amount of replicated routing information on each server increases logarithmically. At the same time, the potential for interquery parallelism is increasing with the growing data-sets because the relative number of servers utilized by individual queries is decreasing. All these properties are verified by experiments on a prototype system using real-life data-sets.

Česky

Tento článek popisuje strukturu pro distribuované podobnostní hledaní v metrických prostorech.

Návaznosti

MSM 143300004, záměr
Název: Digitální knihovny
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Digitální knihovny