A 2008

A Self-organizing System for Large-scale Content-based Information Retrieval

SEDMIDUBSKÝ, Jan

Základní údaje

Originální název

A Self-organizing System for Large-scale Content-based Information Retrieval

Název česky

Samoorganizující se systém pro rozsáhlé vyhledávání dat podle jejich obsahu

Autoři

SEDMIDUBSKÝ, Jan (203 Česká republika, garant)

Vydání

Brno, MEMICS proceedings, 2008

Nakladatel

Ing. Zdeněk Novotný, CSc.

Další údaje

Jazyk

angličtina

Typ výsledku

Audiovizuální tvorba

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/08:00029131

Organizační jednotka

Fakulta informatiky

ISBN

978-80-7355-082-0

Klíčová slova anglicky

similarity search; self-organizing systems

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 8. 12. 2008 16:02, doc. RNDr. Jan Sedmidubský, Ph.D.

Anotace

V originále

We propose a self-organizing system for content-based information retrieval which operates in an ordinary peer-to-peer network. The system is universal and allows us to search for various data types, e.g. multimedia, because we use the metric space data model. The self-organization of the network is obtained by using the social-network paradigm. The connections among peers in the network are created as social-network relationships formed on the basis of a query-and-answer principle. The knowledge of answers to previous queries is exploited to fast navigate to peers, possibly containing the most relevant answers to new queries. At the same time, a randomized mechanism is used to explore new and unvisited parts of the network to provide sufficient information for future exploitation. The proposed concepts are verified using a network consisting of 2,000 peers containing descriptive features of 10 million images from CoPhIR collection.

Česky

Navrhujeme samoorganizující se systém pro vyhledávání dat podle jejich obsahu, který operuje v běžné P2P síti. Celý systém je univerzální a umožňuje uživatelům vyhledávat různé typy dat, např. multimediální data, jelikož pro jejich indexování využíváme výhod metrického prostoru. Samoorganizování sítě je zajištěno využitím konceptu sociálních sítí. Vztahy mezi uzly jsou vytvořeny na základě odpovědí na dotazy. Znalost odpovědí na dotazy je využito pro efektivní nalezení uzlů, které by měly obsahovat relevantní data k danému dotazu. Ve stejnou dobu je využit i algoritmus, který náhodně kontaktuje nějaké uzly za účelem získání nové informaci. Navržený systém je otestován na síti se dvěma tisíci uzly, které indexují deset miliónů obrázků z kolekce CoPhIR.

Návaznosti

GD102/05/H050, projekt VaV
Název: Integrovaný přístup k výchově studentů DSP v oblasti paralelních a distribuovaných systémů
Investor: Grantová agentura ČR, Integrovaný přístup k výchově studentů DSP v oblasti paralelních a distribuovaných systémů