BATKO, Michal, Fabrizio FALCHI, Claudio LUCCHESE, David NOVÁK, Raffaele PEREGO, Fausto RABITTI, Jan SEDMIDUBSKÝ a Pavel ZEZULA. Crawling, Indexing, and Similarity Searching Images on the Web. In Proceedings of the Sixteenth Italian Symposium on Advanced Database Systems. Mondello: Salvatore Gaglio, Ignazio Infantino, Domenico Sacca, 2008, s. 382-389. ISBN 978-88-6122-154-3.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Crawling, Indexing, and Similarity Searching Images on the Web
Název česky Získávání, indexování a podobnostní vyhledávání obrázků na webu
Autoři BATKO, Michal (203 Česká republika, domácí), Fabrizio FALCHI (380 Itálie), Claudio LUCCHESE (380 Itálie), David NOVÁK (203 Česká republika, domácí), Raffaele PEREGO (380 Itálie), Fausto RABITTI (380 Itálie), Jan SEDMIDUBSKÝ (203 Česká republika, domácí) a Pavel ZEZULA (203 Česká republika, garant).
Vydání Mondello, Proceedings of the Sixteenth Italian Symposium on Advanced Database Systems, od s. 382-389, 8 s. 2008.
Nakladatel Salvatore Gaglio, Ignazio Infantino, Domenico Sacca
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Itálie
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
Kód RIV RIV/00216224:14330/08:00024250
Organizační jednotka Fakulta informatiky
ISBN 978-88-6122-154-3
Klíčová slova anglicky similarity search; content-based image retrieval; metric space; MPEG-7 descriptors; peer-to-peer search network
Štítky content-based image retrieval, DISA, Metric Space, MPEG-7 descriptors, peer-to-peer search network, similarity search
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. David Novák, Ph.D., učo 4335. Změněno: 17. 9. 2013 08:51.
Anotace
In this paper, we report on our experience in building an experimental similarity search system on a test collection of more than 50 million images, to show the possibility to scale Content-based Image Retrieval (CBIR) systems towards the Web size. First, we had to tackle the non-trivial process of image crawling and descriptive feature extraction, performed by using the European EGEE computer GRID, building a test collection, the first of such scale, that will be opened to the research community for experiments and comparisons. Then, we had to develop indexing and searching mechanisms which can scale up to these volumes and answer similarity queries in real-time. The results of our experiments are very encouraging for future applications.
Anotace česky
V tomto článku prezentujeme naše zkušenosti získané z budování experimentálního systému pro podobnostní hledání na datové množině obsahující více jak 50 miliónů obrázků. Nejdříve jsme museli vyřešit netriviální proces získávání obrázků a jejich popisů pro vytvoření testovací sady, první takového rozsahu, která bude k dispozici všem výzkumníkům pro různé experimenty a porovnání. Potom jsme museli vyvinout indexovací a vyhledávací mechanismy, které umožňují škálovat to takových objemů a zároveň zodpovídat podobnostní dotazy v reálném čase. Výsledky našich experimentů jsou velice slibné pro budoucí aplikace.
Návaznosti
GD102/05/H050, projekt VaVNázev: Integrovaný přístup k výchově studentů DSP v oblasti paralelních a distribuovaných systémů
Investor: Grantová agentura ČR, Integrovaný přístup k výchově studentů DSP v oblasti paralelních a distribuovaných systémů
GP201/08/P507, projekt VaVNázev: Komplexní podobnostní dotazy nad rozsáhlými objemy dat
Investor: Grantová agentura ČR, Komplexní podobnostní dotazy nad rozsáhlými objemy dat
1ET100300419, projekt VaVNázev: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
VytisknoutZobrazeno: 25. 4. 2024 08:09