D 2009

Distinct nearest neighbors queries for similarity search in very large multimedia databases

SKOPAL, Tomáš, Vlastislav DOHNAL, Michal BATKO and Pavel ZEZULA

Basic information

Original name

Distinct nearest neighbors queries for similarity search in very large multimedia databases

Name in Czech

Dotazovaní na rozlišitelné nejlibližší sousedy pro podobnostní hledání ve velmi velkých multimediálních databázích

Authors

SKOPAL, Tomáš (203 Czech Republic), Vlastislav DOHNAL (203 Czech Republic, guarantor), Michal BATKO (203 Czech Republic) and Pavel ZEZULA (203 Czech Republic)

Edition

New York, USA, 11th ACM International Workshop on Web Information and Data Management (WIDM 2009), p. 11-14, 4 pp. 2009

Publisher

ACM

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

United States of America

Confidentiality degree

není předmětem státního či obchodního tajemství

References:

RIV identification code

RIV/00216224:14330/09:00029810

Organization unit

Faculty of Informatics

ISBN

978-1-60558-808-7

Keywords in English

similarity search;kNN query;content-based retrieval

Tags

Tags

International impact, Reviewed
Změněno: 30/3/2010 09:07, doc. RNDr. Vlastislav Dohnal, Ph.D.

Abstract

V originále

As the volume of multimedia data available on internet is tremendously increasing, the content-based similarity search becomes a popular approach to multimedia retrieval. The most popular retrieval concept is the k nearest neighbor (kNN) search. For a long time, the kNN queries provided an effective retrieval in multimedia databases. However, as today's multimedia databases available on the web grow to massive volumes, the classic kNN query quickly loses its descriptive power. In this paper, we introduce a new similarity query type, the k distinct nearest neighbors (kDNN), which aims to generalize the classic kNN query to be more robust with respect to the database size. In addition to retrieving just objects similar to the query example, the kDNN further ensures the objects within the result have to be distinct enough, i.e. excluding near duplicates.

In Czech

S tím, jak se značně rozšiřuje množství multimediálních dat dostupných prostřednictvím internetu, roste při jejich vyhledávání popularita podobnostního přístupu. Nejběžnějším konceptem je hledání k nejbližších sousedů (kNN), který se v multimediálních databázích efektivně používá již dlouhou dobu. Bohužel s tím jak objem multimediálních dat masivně narostl, tento přístup poskytuje stále méně užitečných informací. V tomto článku prezentujeme nový podobnostní dotaz - dotaz na k rozlišitelných nejbližších sousedů (kDNN) - který si klade za cíl zobecnit klasický kNN dotaz tak, aby byl robustnější s ohledem na množství prohledávaných dat. Oproti kNN dotazu, který vrací objekty podobné zadanému příkladu, kDNN dotaz navíc zajišťuje, že budou odpovědi dostatečně rozdílné, tj. že odpověď neobsahuje blízké duplikáty.

Links

GA201/09/0683, research and development project
Name: Vyhledávání v rozsáhlých multimediálních databázích
Investor: Czech Science Foundation, Similarity Searching in Very Large Multimedia Databases
GP201/07/P240, research and development project
Name: Distribuované indexační struktury pro podobnostní hledání
Investor: Czech Science Foundation, Distributed Index Structures for Similarity Searching
GP201/08/P507, research and development project
Name: Komplexní podobnostní dotazy nad rozsáhlými objemy dat
Investor: Czech Science Foundation, Complex similarity searching in very large data collections