2008
A Self-organizing System for Large-scale Content-based Information Retrieval
SEDMIDUBSKÝ, JanZákladní údaje
Originální název
A Self-organizing System for Large-scale Content-based Information Retrieval
Název česky
Samoorganizující se systém pro rozsáhlé vyhledávání dat podle jejich obsahu
Autoři
SEDMIDUBSKÝ, Jan (203 Česká republika, garant)
Vydání
Brno, MEMICS proceedings, 2008
Nakladatel
Ing. Zdeněk Novotný, CSc.
Další údaje
Jazyk
angličtina
Typ výsledku
Audiovizuální tvorba
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/08:00029131
Organizační jednotka
Fakulta informatiky
ISBN
978-80-7355-082-0
Klíčová slova anglicky
similarity search; self-organizing systems
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 8. 12. 2008 16:02, doc. RNDr. Jan Sedmidubský, Ph.D.
V originále
We propose a self-organizing system for content-based information retrieval which operates in an ordinary peer-to-peer network. The system is universal and allows us to search for various data types, e.g. multimedia, because we use the metric space data model. The self-organization of the network is obtained by using the social-network paradigm. The connections among peers in the network are created as social-network relationships formed on the basis of a query-and-answer principle. The knowledge of answers to previous queries is exploited to fast navigate to peers, possibly containing the most relevant answers to new queries. At the same time, a randomized mechanism is used to explore new and unvisited parts of the network to provide sufficient information for future exploitation. The proposed concepts are verified using a network consisting of 2,000 peers containing descriptive features of 10 million images from CoPhIR collection.
Česky
Navrhujeme samoorganizující se systém pro vyhledávání dat podle jejich obsahu, který operuje v běžné P2P síti. Celý systém je univerzální a umožňuje uživatelům vyhledávat různé typy dat, např. multimediální data, jelikož pro jejich indexování využíváme výhod metrického prostoru. Samoorganizování sítě je zajištěno využitím konceptu sociálních sítí. Vztahy mezi uzly jsou vytvořeny na základě odpovědí na dotazy. Znalost odpovědí na dotazy je využito pro efektivní nalezení uzlů, které by měly obsahovat relevantní data k danému dotazu. Ve stejnou dobu je využit i algoritmus, který náhodně kontaktuje nějaké uzly za účelem získání nové informaci. Navržený systém je otestován na síti se dvěma tisíci uzly, které indexují deset miliónů obrázků z kolekce CoPhIR.
Návaznosti
GD102/05/H050, projekt VaV |
|