D 2005

Indexing the Distance Using Chord: A Distributed Similarity Search Structure

NOVÁK, David a Pavel ZEZULA

Základní údaje

Originální název

Indexing the Distance Using Chord: A Distributed Similarity Search Structure

Název česky

Indexování vzdálenosti pomocí Chordu: Distribuovaná struktura pro podobnostní vyhledávání

Autoři

NOVÁK, David (203 Česká republika, garant) a Pavel ZEZULA (203 Česká republika)

Vydání

Schloss Dagstuhl, Germany, 8th International Workshop of the DELOS Network of Excellence on Digital Libraries, od s. 94-108, 15 s. 2005

Nakladatel

Neuveden

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Německo

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/05:00013436

Organizační jednotka

Fakulta informatiky

Klíčová slova anglicky

indexing; similarity; peer-to-peer
Změněno: 19. 2. 2007 09:43, RNDr. David Novák, Ph.D.

Anotace

V originále

The need of search mechanisms based on data content rather then attributes values has recently lead to formation of the metric-based similarity retrieval. The computational complexity of such retrieval and the large volume of processed data call for distributed processing. In this paper, we propose chiDistance, a distributed data structure for similarity search in metric spaces. The structure is based on the idea of a vector-based index method iDistance which enables to transform the issue of similarity search into the one-dimensional range search problem. A~Peer-to-Peer system based on the Chord protocol is created to distribute the storage space and to parallelize the execution of similarity queries. In the experiments conducted on our prototype implementation we study the system performance concentrating on several aspects of parallelism of the range search algorithm.

Česky

Práce navrhuje novou distribuovanou datovou strukturu, která podporuje podobnostní hledání používající obecný metrický prostor jako datovou abstrakci.

Návaznosti

1ET100300419, projekt VaV
Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu