BATKO, Michal, Fabrizio FALCHI, Claudio LUCCHESE, David NOVÁK, Raffaele PEREGO, Fausto RABITTI, Jan SEDMIDUBSKÝ a Pavel ZEZULA. Building a Web-scale Image Similarity Search System. Multimedia Tools and Applications. Springer Netherlands, 2010, roč. 47, č. 3, s. 599-629. ISSN 1380-7501.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Building a Web-scale Image Similarity Search System
Název česky Budování rozsáhlého systému pro podobnostní vyhledávání v obrázcích
Autoři BATKO, Michal (203 Česká republika, domácí), Fabrizio FALCHI (380 Itálie), Claudio LUCCHESE (380 Itálie), David NOVÁK (203 Česká republika, domácí), Raffaele PEREGO (380 Itálie), Fausto RABITTI (380 Itálie), Jan SEDMIDUBSKÝ (203 Česká republika, garant, domácí) a Pavel ZEZULA (203 Česká republika, domácí).
Vydání Multimedia Tools and Applications, Springer Netherlands, 2010, 1380-7501.
Další údaje
Originální jazyk angličtina
Typ výsledku Článek v odborném periodiku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Spojené státy
Utajení není předmětem státního či obchodního tajemství
WWW URL
Impakt faktor Impact factor: 0.914
Kód RIV RIV/00216224:14330/10:00042682
Organizační jednotka Fakulta informatiky
UT WoS 000275800200012
Klíčová slova anglicky similarity search; content-based image retrieval; metric space; MPEG-7 descriptors; peer-to-peer search network
Štítky DISA
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 10. 3. 2016 11:28.
Anotace
As the number of digital images is growing fast and Content-based Image Retrieval (CBIR) is gaining in popularity, CBIR systems should leap towards Web-scale datasets. In this paper, we report on our experience in building an experimental similarity search system on a test collection of more than 50 million images. The first big challenge we have been facing was obtaining a collection of images of this scale with the corresponding descriptive features. We have tackled the non-trivial process of image crawling and extraction of several MPEG-7 descriptors. The result of this effort is a test collection, the first of such scale, opened to the research community for experiments and comparisons. The second challenge was to develop indexing and searching mechanisms able to scale to the target size and to answer similarity queries in real-time. We have achieved this goal by creating sophisticated centralized and distributed structures based purely on the metric space model of data. We have joined them together which has resulted in an extremely flexible and scalable solution. In this paper, we study in detail the performance of this technology and its evolvement as the data volume grows by three orders of magnitude. The results of the experiments are very encouraging and promising for future applications.
Anotace česky
S obrovským rozmachem digitálních obrázků je třeba navrhnout systémy, které budou schopny vyhledávat ve velkých kolekcích obrázků podle jejich obsahu. V tomto článku prezentujeme naše zkušenosti získané z budování experimentálního systému pro podobnostní hledání na datové množině obsahující více jak 50 miliónů obrázků. Nejdříve jsme museli vyřešit netriviální proces získávání obrázků a jejich popisů pro vytvoření testovací sady, první takového rozsahu, která bude k dispozici všem výzkumníkům pro různé experimenty a porovnání. Potom jsme museli vyvinout indexovací a vyhledávací mechanismy, které umožňují škálovat to takových objemů a zároveň zodpovídat podobnostní dotazy v reálném čase. Výsledky našich experimentů jsou velice slibné pro budoucí aplikace.
Návaznosti
GA201/09/0683, projekt VaVNázev: Vyhledávání v rozsáhlých multimediálních databázích
Investor: Grantová agentura ČR, Vyhledávání v rozsáhlých multimediálních databázích
GD102/09/H042, projekt VaVNázev: Matematické a inženýrské metody pro vývoj spolehlivých a bezpečných paralelních a distribuovaných počítačových systémů
Investor: Grantová agentura ČR, Matematické a inženýrské metody pro vývoj spolehlivých a bezpečných paralelních a distribuovaných počítačových systémů
GP201/08/P507, projekt VaVNázev: Komplexní podobnostní dotazy nad rozsáhlými objemy dat
Investor: Grantová agentura ČR, Komplexní podobnostní dotazy nad rozsáhlými objemy dat
1M0545, projekt VaVNázev: Institut Teoretické Informatiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Institut Teoretické Informatiky
VytisknoutZobrazeno: 25. 4. 2024 07:14