D 2005

Similarity Grid for Searching in Metric Spaces

BATKO, Michal; Claudio GENNARO a Pavel ZEZULA

Základní údaje

Originální název

Similarity Grid for Searching in Metric Spaces

Název česky

Podobnostní GRID pro hledání v metrických prostrorech

Autoři

BATKO, Michal; Claudio GENNARO a Pavel ZEZULA

Vydání

Berlin, Peer-to-Peer, Grid, and Service-Orientation in Digital Library Architectures: 6th Thematic Workshop of the EU Network of Excellence DELOS. Revised Selected Papers. LNCS 3664, od s. 25-44, 20 s. 2005

Nakladatel

Springer-Verlag Heidelberg

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

20206 Computer hardware and architecture

Stát vydavatele

Německo

Utajení

není předmětem státního či obchodního tajemství

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14610/05:00013400

Organizační jednotka

Ústav výpočetní techniky

ISBN

3-540-28711-6

Klíčová slova anglicky

distributed data; scalable structures; similarity search; metric space

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 29. 6. 2009 14:42, RNDr. Michal Batko, Ph.D.

Anotace

V originále

Similarity search in metric spaces represents an important paradigm for content-based retrieval of many applications. Existing centralized search structures can speed-up retrieval, but they do not scale up to large volume of data because the response time is linearly increasing with the size of the searched file. The proposed GHT* index is a scalable and distributed structure. By exploiting parallelism in a dynamic network of computers, the GHT* achieves practically constant search time for similarity range queries in data-sets of arbitrary size. The structure also scales well with respect to the growing volume of retrieved data. Moreover, a small amount of replicated routing information on each server increases logarithmically. At the same time, the potential for interquery parallelism is increasing with the growing data-sets because the relative number of servers utilized by individual queries is decreasing. All these properties are verified by experiments on a prototype system using real-life data-sets.

Česky

Podobnostní hledání v centralizovaném prostředí se ukazuje nedostatečným z hlediska škálovatelnosti. GHT* je distribuovaná struktura pro podobnostní hledání, založeném na metrických prostorech, která dosahuje prakticky konstantní odezvy pro libovolně rozsáhlá data.

Návaznosti

1ET100300419, projekt VaV
Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu