2005
Similarity Grid for Searching in Metric Spaces
BATKO, Michal; Claudio GENNARO a Pavel ZEZULAZákladní údaje
Originální název
Similarity Grid for Searching in Metric Spaces
Název česky
Podobnostní GRID pro hledání v metrických prostrorech
Autoři
BATKO, Michal; Claudio GENNARO a Pavel ZEZULA
Vydání
Berlin, Peer-to-Peer, Grid, and Service-Orientation in Digital Library Architectures: 6th Thematic Workshop of the EU Network of Excellence DELOS. Revised Selected Papers. LNCS 3664, od s. 25-44, 20 s. 2005
Nakladatel
Springer-Verlag Heidelberg
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
20206 Computer hardware and architecture
Stát vydavatele
Německo
Utajení
není předmětem státního či obchodního tajemství
Označené pro přenos do RIV
Ano
Kód RIV
RIV/00216224:14610/05:00013400
Organizační jednotka
Ústav výpočetní techniky
ISBN
3-540-28711-6
UT WoS
Klíčová slova anglicky
distributed data; scalable structures; similarity search; metric space
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 29. 6. 2009 14:42, RNDr. Michal Batko, Ph.D.
V originále
Similarity search in metric spaces represents an important paradigm for content-based retrieval of many applications. Existing centralized search structures can speed-up retrieval, but they do not scale up to large volume of data because the response time is linearly increasing with the size of the searched file. The proposed GHT* index is a scalable and distributed structure. By exploiting parallelism in a dynamic network of computers, the GHT* achieves practically constant search time for similarity range queries in data-sets of arbitrary size. The structure also scales well with respect to the growing volume of retrieved data. Moreover, a small amount of replicated routing information on each server increases logarithmically. At the same time, the potential for interquery parallelism is increasing with the growing data-sets because the relative number of servers utilized by individual queries is decreasing. All these properties are verified by experiments on a prototype system using real-life data-sets.
Česky
Podobnostní hledání v centralizovaném prostředí se ukazuje nedostatečným z hlediska škálovatelnosti. GHT* je distribuovaná struktura pro podobnostní hledání, založeném na metrických prostorech, která dosahuje prakticky konstantní odezvy pro libovolně rozsáhlá data.
Návaznosti
| 1ET100300419, projekt VaV |
|