2004
An Access Structure for Similarity Search in Metric Spaces
DOHNAL, VlastislavZákladní údaje
Originální název
An Access Structure for Similarity Search in Metric Spaces
Název česky
Indexová struktura pro podobnostní hledání v metrických prostorech
Autoři
DOHNAL, Vlastislav (203 Česká republika, garant)
Vydání
Greece, Proceedings of ICDE/EDBT 2004 Joint Ph.D. Workshop, 18 March 2004, Heraklion, Greece and 29 March 2004, Boston, MA, USA, od s. 149-158, 10 s. 2004
Nakladatel
Crete University Press
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/04:00010797
Organizační jednotka
Fakulta informatiky
ISBN
960-524-177-3
UT WoS
000226132200013
Klíčová slova anglicky
similarity search; access structure; metric space
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 22. 10. 2010 16:13, doc. RNDr. Vlastislav Dohnal, Ph.D.
V originále
Similarity retrieval is an important paradigm for searching in environments where exact match has little meaning. Moreover, in order to enlarge the set of data types for which the similarity search can efficiently be performed, the mathematical notion of metric space provides a useful abstraction of similarity. In this paper, we present a novel access structure for similarity search in arbitrary metric spaces, called D-Index. D-Index supports easy insertions and deletions and bounded search costs for range queries with radius up to $\rho$. D-Index also supports disk memories, thus, it is able to deal with large archives. However, the partitioning principles employed in the D-Index are not very optimal since they produce high number of empty partitions. We propose several strategies of partitioning and, finally, compare them.
Česky
Podobností hledání je důležité v prostředích, ve kterých hledání na přesnou shodu má malý význam. Pro zvýšení okruhu aplikovatelnosti podobnostního hledání se jako matematická abstrakce používá pojem metrického prostoru. V tomto článku popisujeme novou indexovou metodu pro podobnostní hledání nazvanou D-Index. D-Index vkládá a maže datové objekty s velmi nízkými náklady. Rozsahové dotazy s poloměrem menším než rho jsou řešeny v čase, který je shora omezený. D-Index také podporuje disková úložiště a tím je schopen pracovat i s velkými objemy dat, které překračují velikost vnitřní paměti. Protože metody pro dělení prostoru použité v D-Indexu nejsou příliš optimální a vytvářejí velké množství prázdných oblastí, navrhujeme několik metod dělení a porovnáváme je.
Návaznosti
MSM 143300004, záměr |
|