D 2009

Distinct nearest neighbors queries for similarity search in very large multimedia databases

SKOPAL, Tomáš, Vlastislav DOHNAL, Michal BATKO a Pavel ZEZULA

Základní údaje

Originální název

Distinct nearest neighbors queries for similarity search in very large multimedia databases

Název česky

Dotazovaní na rozlišitelné nejlibližší sousedy pro podobnostní hledání ve velmi velkých multimediálních databázích

Autoři

SKOPAL, Tomáš (203 Česká republika), Vlastislav DOHNAL (203 Česká republika, garant), Michal BATKO (203 Česká republika) a Pavel ZEZULA (203 Česká republika)

Vydání

New York, USA, 11th ACM International Workshop on Web Information and Data Management (WIDM 2009), od s. 11-14, 4 s. 2009

Nakladatel

ACM

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Spojené státy

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/09:00029810

Organizační jednotka

Fakulta informatiky

ISBN

978-1-60558-808-7

Klíčová slova anglicky

similarity search;kNN query;content-based retrieval

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 30. 3. 2010 09:07, doc. RNDr. Vlastislav Dohnal, Ph.D.

Anotace

V originále

As the volume of multimedia data available on internet is tremendously increasing, the content-based similarity search becomes a popular approach to multimedia retrieval. The most popular retrieval concept is the k nearest neighbor (kNN) search. For a long time, the kNN queries provided an effective retrieval in multimedia databases. However, as today's multimedia databases available on the web grow to massive volumes, the classic kNN query quickly loses its descriptive power. In this paper, we introduce a new similarity query type, the k distinct nearest neighbors (kDNN), which aims to generalize the classic kNN query to be more robust with respect to the database size. In addition to retrieving just objects similar to the query example, the kDNN further ensures the objects within the result have to be distinct enough, i.e. excluding near duplicates.

Česky

S tím, jak se značně rozšiřuje množství multimediálních dat dostupných prostřednictvím internetu, roste při jejich vyhledávání popularita podobnostního přístupu. Nejběžnějším konceptem je hledání k nejbližších sousedů (kNN), který se v multimediálních databázích efektivně používá již dlouhou dobu. Bohužel s tím jak objem multimediálních dat masivně narostl, tento přístup poskytuje stále méně užitečných informací. V tomto článku prezentujeme nový podobnostní dotaz - dotaz na k rozlišitelných nejbližších sousedů (kDNN) - který si klade za cíl zobecnit klasický kNN dotaz tak, aby byl robustnější s ohledem na množství prohledávaných dat. Oproti kNN dotazu, který vrací objekty podobné zadanému příkladu, kDNN dotaz navíc zajišťuje, že budou odpovědi dostatečně rozdílné, tj. že odpověď neobsahuje blízké duplikáty.

Návaznosti

GA201/09/0683, projekt VaV
Název: Vyhledávání v rozsáhlých multimediálních databázích
Investor: Grantová agentura ČR, Vyhledávání v rozsáhlých multimediálních databázích
GP201/07/P240, projekt VaV
Název: Distribuované indexační struktury pro podobnostní hledání
Investor: Grantová agentura ČR, Distribuované indexační struktury pro podobnostní hledání
GP201/08/P507, projekt VaV
Název: Komplexní podobnostní dotazy nad rozsáhlými objemy dat
Investor: Grantová agentura ČR, Komplexní podobnostní dotazy nad rozsáhlými objemy dat