V originále
The proliferation of information housed in computerized domains makes it vital to find tools to search these resources efficiently and effectively. Ordinary retrieval techniques are inadequate because sorting is simply impossible. Consequently, proximity searching has become a fundamental computation task in a variety of application areas. Similarity Search focuses on the state of the art in developing index structures for searching the metric space. Part I of the text describes major theoretical principles, and provides an extensive survey of specific techniques for a large range of applications. Part II concentrates on approaches particularly designed for searching in large collections of data. After describing the most popular centralized disk-based metric indexes, approximation techniques are presented as a way to significantly speed up search time at the cost of some imprecision in query results. Finally, the scalable and distributed metric structures are discussed.
Česky
Rozšiřování objemu informací zpracovávaných počítači vede k potřebě hledat nástroje pro jejich efektivní a přesné prohledávání. Běžné vyhledávací techniky jsou často nevhodné, protože nedovolují jistou míru nepřesnosti. Proto se podobnostní hledání stává základem v různých aplikačních oblastech. Kniha Podobnostní hledání se zaměřuje na současné trendy ve vývoji indexových technik pro prohledávání dat modelovaných pomocí metrických prostorů. Část první popisuje hlavní teoretické principy a obsahuje rozsáhlý přehled rozličných technik. Část druhá se zaměřuje na přístupy vyvíjené se zvláštním důrazem na zpracování velkých objemů dat a je rozdělena na tři podoblasti. První je věnována centralizovaným indexům, které podporují disková úložiště. Druhá se zabývá problematikou aproximace, která umožňuje významné urychlení stávajících algoritmů za cenu jisté nepřesnosti ve výsledcích. Poslední oblast diskutuje distribuované přístupy k podobnostnímu hledání.