D 2009

CoPhIR Image Collection under the Microscope

BATKO, Michal, Petra BUDÍKOVÁ a David NOVÁK

Základní údaje

Originální název

CoPhIR Image Collection under the Microscope

Název česky

Kolekce obrázků CoPhIR pod drobnohledem

Autoři

BATKO, Michal (203 Česká republika, domácí), Petra BUDÍKOVÁ (203 Česká republika, domácí) a David NOVÁK (203 Česká republika, garant, domácí)

Vydání

Washington, DC, USA, Proceedings of the 2009 Second International Workshop on Similarity Search and Applications, od s. 47-54, 8 s. 2009

Nakladatel

IEEE Computer Society

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Spojené státy

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14330/09:00029662

Organizační jednotka

Fakulta informatiky

ISBN

978-0-7695-3765-8

UT WoS

000282087600006

Klíčová slova anglicky

metric space; MPEG-7; visual descriptors; CoPhIR dataset; dataset analysis

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 14. 3. 2016 14:49, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

The Content-based Photo Image Retrieval (CoPhIR) dataset is the largest available database of digital images with corresponding visual descriptors. It contains five MPEG-7 global descriptors extracted from more than 106 million images from Flickr photo-sharing system. In this paper, we analyze this dataset focusing on 1) efficiency of similarity-based indexing and searching and on 2) expressiveness of combination of the descriptors with respect to subjective perception of visual similarity. We treat the descriptors as metric spaces and then combine them into a multi-metric space. We analyze distance distributions of individual descriptors, measure intrinsic dimensionality of these datasets and statistically evaluate correlation between these descriptors. Further, we use two methods to assess subjective accuracy and satisfaction of similarity retrieval based on a combination of descriptors that is recommended for CoPhIR, and we compare these results on databases of 10 and 100 million CoPhIR images. Finally, we suggest, explore and evaluate two approaches to improve the accuracy: 1) applying logarithms in order to weaken influence of a single descriptor contribution if it deviates from the rest, and 2) the possibility of categorization of the dataset and identifying visual characteristics important for individual categories.

Česky

CoPhIR (Content-based Photo Image Retrieval) je největší dostupná databáze...

Návaznosti

GA201/09/0683, projekt VaV
Název: Vyhledávání v rozsáhlých multimediálních databázích
Investor: Grantová agentura ČR, Vyhledávání v rozsáhlých multimediálních databázích