DOHNAL, Vlastislav. An Access Structure for Similarity Search in Metric Spaces. In Proceedings of ICDE/EDBT 2004 Joint Ph.D. Workshop, 18 March 2004, Heraklion, Greece and 29 March 2004, Boston, MA, USA. Greece: Crete University Press, 2004, p. 149-158. ISBN 960-524-177-3.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name An Access Structure for Similarity Search in Metric Spaces
Name in Czech Indexová struktura pro podobnostní hledání v metrických prostorech
Authors DOHNAL, Vlastislav (203 Czech Republic, guarantor).
Edition Greece, Proceedings of ICDE/EDBT 2004 Joint Ph.D. Workshop, 18 March 2004, Heraklion, Greece and 29 March 2004, Boston, MA, USA, p. 149-158, 10 pp. 2004.
Publisher Crete University Press
Other information
Original language English
Type of outcome Proceedings paper
Field of Study 10201 Computer sciences, information science, bioinformatics
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
RIV identification code RIV/00216224:14330/04:00010797
Organization unit Faculty of Informatics
ISBN 960-524-177-3
UT WoS 000226132200013
Keywords in English similarity search; access structure; metric space
Tags access structure, DISA, Metric Space, similarity search
Tags International impact, Reviewed
Changed by Changed by: doc. RNDr. Vlastislav Dohnal, Ph.D., učo 2952. Changed: 22/10/2010 16:13.
Abstract
Similarity retrieval is an important paradigm for searching in environments where exact match has little meaning. Moreover, in order to enlarge the set of data types for which the similarity search can efficiently be performed, the mathematical notion of metric space provides a useful abstraction of similarity. In this paper, we present a novel access structure for similarity search in arbitrary metric spaces, called D-Index. D-Index supports easy insertions and deletions and bounded search costs for range queries with radius up to $\rho$. D-Index also supports disk memories, thus, it is able to deal with large archives. However, the partitioning principles employed in the D-Index are not very optimal since they produce high number of empty partitions. We propose several strategies of partitioning and, finally, compare them.
Abstract (in Czech)
Podobností hledání je důležité v prostředích, ve kterých hledání na přesnou shodu má malý význam. Pro zvýšení okruhu aplikovatelnosti podobnostního hledání se jako matematická abstrakce používá pojem metrického prostoru. V tomto článku popisujeme novou indexovou metodu pro podobnostní hledání nazvanou D-Index. D-Index vkládá a maže datové objekty s velmi nízkými náklady. Rozsahové dotazy s poloměrem menším než rho jsou řešeny v čase, který je shora omezený. D-Index také podporuje disková úložiště a tím je schopen pracovat i s velkými objemy dat, které překračují velikost vnitřní paměti. Protože metody pro dělení prostoru použité v D-Indexu nejsou příliš optimální a vytvářejí velké množství prázdných oblastí, navrhujeme několik metod dělení a porovnáváme je.
Links
MSM 143300004, plan (intention)Name: Digitální knihovny
Investor: Ministry of Education, Youth and Sports of the CR, Digital libraries
PrintDisplayed: 27/4/2024 19:29