B 2005

Similarity Search: The Metric Space Approach

ZEZULA, Pavel, Giuseppe AMATO, Vlastislav DOHNAL and Michal BATKO

Basic information

Original name

Similarity Search: The Metric Space Approach

Name in Czech

Podobnostní hledání: Pohled metrického prostoru

Authors

ZEZULA, Pavel (203 Czech Republic), Giuseppe AMATO (380 Italy), Vlastislav DOHNAL (203 Czech Republic, guarantor) and Michal BATKO (203 Czech Republic)

Edition

2005. vyd. New York, NY 10013, USA, 220 pp. Advances in Database Systems, Vol. 32, 2005

Publisher

Springer

Other information

Language

English

Type of outcome

Odborná kniha

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

RIV identification code

RIV/00216224:14330/05:00013399

Organization unit

Faculty of Informatics

ISBN

0-387-29146-6

Keywords in English

similarity search; metric space; index structures; scalability; performance evaluation

Tags

International impact
Změněno: 23/6/2009 12:47, doc. RNDr. Vlastislav Dohnal, Ph.D.

Abstract

V originále

The proliferation of information housed in computerized domains makes it vital to find tools to search these resources efficiently and effectively. Ordinary retrieval techniques are inadequate because sorting is simply impossible. Consequently, proximity searching has become a fundamental computation task in a variety of application areas. Similarity Search focuses on the state of the art in developing index structures for searching the metric space. Part I of the text describes major theoretical principles, and provides an extensive survey of specific techniques for a large range of applications. Part II concentrates on approaches particularly designed for searching in large collections of data. After describing the most popular centralized disk-based metric indexes, approximation techniques are presented as a way to significantly speed up search time at the cost of some imprecision in query results. Finally, the scalable and distributed metric structures are discussed.

In Czech

Rozšiřování objemu informací zpracovávaných počítači vede k potřebě hledat nástroje pro jejich efektivní a přesné prohledávání. Běžné vyhledávací techniky jsou často nevhodné, protože nedovolují jistou míru nepřesnosti. Proto se podobnostní hledání stává základem v různých aplikačních oblastech. Kniha Podobnostní hledání se zaměřuje na současné trendy ve vývoji indexových technik pro prohledávání dat modelovaných pomocí metrických prostorů. Část první popisuje hlavní teoretické principy a obsahuje rozsáhlý přehled rozličných technik. Část druhá se zaměřuje na přístupy vyvíjené se zvláštním důrazem na zpracování velkých objemů dat a je rozdělena na tři podoblasti. První je věnována centralizovaným indexům, které podporují disková úložiště. Druhá se zabývá problematikou aproximace, která umožňuje významné urychlení stávajících algoritmů za cenu jisté nepřesnosti ve výsledcích. Poslední oblast diskutuje distribuované přístupy k podobnostnímu hledání.

Links

1ET100300419, research and development project
Name: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Academy of Sciences of the Czech Republic, Intelligent Models, Algorithms, Methods and Tools for the Semantic Web (realization)