Combining Metric Features in Large Collections

BATKO, Michal, Petra KOHOUTKOVÁ a Pavel ZEZULA. Combining Metric Features in Large Collections. In 1st International Workshop on Similarity Search and Applications (SISAP 2008). Los Alamitos CA, Washington, Tokyo: IEEE Computer Society, 2008, s. 79-86. ISBN 978-0-7695-3101-4.

Další formáty: BibTeX LaTeX RIS

Základní údaje
Originální název	Combining Metric Features in Large Collections
Název česky	Kombinování metrických charakteristik ve velkých kolekcích dat
Autoři	BATKO, Michal (203 Česká republika, garant), Petra KOHOUTKOVÁ (203 Česká republika) a Pavel ZEZULA (203 Česká republika).
Vydání	Los Alamitos CA, Washington, Tokyo, 1st International Workshop on Similarity Search and Applications (SISAP 2008), od s. 79-86, 8 s. 2008.
Nakladatel	IEEE Computer Society

Další údaje
Originální jazyk	angličtina
Typ výsledku	Stať ve sborníku
Obor	10201 Computer sciences, information science, bioinformatics
Stát vydavatele	Mexiko
Utajení	není předmětem státního či obchodního tajemství
WWW	URL
Kód RIV	RIV/00216224:14330/08:00024185
Organizační jednotka	Fakulta informatiky
ISBN	978-0-7695-3101-4
UT WoS	000255509900009
Klíčová slova anglicky	similarity search; complex query; p2p network; approximation
Štítky	APPROXIMATION, complex query, DISA, p2p network, similarity search
Příznaky	Mezinárodní význam, Recenzováno
Změnil	Změnil: RNDr. Michal Batko, Ph.D., učo 2907. Změněno: 19. 6. 2009 16:21.

Anotace

Current information systems are required to process complex digital objects, which are typically characterized by multiple descriptors. Since the values of many descriptors belong to non-sortable domains, they are effectively comparable only by a sort ofsimilarity. Moreover, the scalability is very important in the current digital-explosion age. Therefore, we propose a distributed extension of the well-known threshold algorithm for peer-to-peer paradigm. The technique allows to answer similarity queries that combine multiple similarity measures and due to its peer-to-peer nature it is highly scalable. We also explore possibilities of approximate evaluation strategies, where some relevant results can be lost in favor of increasing the efficiency by order of magnitude. To reveal the strengths and weaknesses of our approach we have experimented with a 1.6 million image database from Flicker comparing the content of the images by five similarity measures from the MPEG-7 standard. To the best of our knowledge, the experience with such a huge real-life dataset is quite unique.

Anotace česky

Článek popisuje rozšíření existujícího "prahovacího" algoritmu pro prostředí peer-to-peer sítí. Technika umožňuje řešit podobnostní dotazy kombinující několik podobnostních měřítek a díky využití peer-to-peer technologie je vysoce škálovatelná. Dále jsou v článku rozebírany přínosy aproximativní strategie. Výsledky jsou ověřeny na databázi s 1,6 miliony obrázků ze systému Flickr.

Návaznosti
GP201/08/P507, projekt VaV	Název: Komplexní podobnostní dotazy nad rozsáhlými objemy dat
GP201/08/P507, projekt VaV	Investor: Grantová agentura ČR, Komplexní podobnostní dotazy nad rozsáhlými objemy dat
1ET100300419, projekt VaV	Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
1ET100300419, projekt VaV	Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu

VytisknoutZobrazeno: 26. 4. 2024 17:35

Combining Metric Features in Large Collections

Další aplikace