Query Language for Complex Similarity Queries

D 2012

Query Language for Complex Similarity Queries

BUDÍKOVÁ, Petra, Michal BATKO a Pavel ZEZULA

Základní údaje

Originální název

Query Language for Complex Similarity Queries

Autoři

BUDÍKOVÁ, Petra (203 Česká republika, garant, domácí), Michal BATKO (203 Česká republika, domácí) a Pavel ZEZULA (203 Česká republika, domácí)

Vydání

Berlin, Advances in Databases and Information Systems, LNCS 7503, od s. 85-98, 14 s. 2012

Nakladatel

Springer-Verlag

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Polsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Impakt faktor

Impact factor: 0.402 v roce 2005

Kód RIV

RIV/00216224:14330/12:00057802

Organizační jednotka

Fakulta informatiky

ISBN

978-3-642-33073-5

ISSN

DOI

http://dx.doi.org/10.1007/978-3-642-33074-2_7

Klíčová slova anglicky

query language; SQL; similarity search

Štítky

DISA

Příznaky

Mezinárodní význam, Recenzováno

Změněno: 23. 4. 2013 13:23, RNDr. Pavel Šmerk, Ph.D.

Anotace

ORIG CZ

V originále

For complex data types such as multimedia, traditional data management methods are no longer suitable. Instead of attribute matching approaches, access methods based on object similarity are becoming popular in many applications. Nowadays, efficient methods for similarity search are already available, but using them to build an actual search system still requires specialists that tune the methods and build the system. In this paper, we propose a novel query language that generalizes existing solutions and allows to formulate content-based queries in a flexible way, supporting various advanced query operations such as similarity joins, reverse nearest neighbor queries, or distinct kNN queries, as well as multi-object and multi-modal queries. The language is primarily designed to be used with the MESSIF – a framework for content-based searching – but can be employed by other retrieval systems as well.

Česky

Tradiční metody pro správu atributových dat nejsou vhodné pro složité datové typy, jakými jsou například multimédia. Taková data jsou stále častěji organizována a prohledávána pomocí vnitřní podobnosti obsahu. V minulých letech byly intenzivně zkoumány metody umožňující efektivně indexovat a prohledávat data na základě podobnosti, a v současnosti již existují fungující systémy využívající tohoto principu. Jejich použití však vyžaduje pokročilé znalosti. Existují i první nástroje, které mají poskytnout intuitivní rozhraní k takovým systémům, ale jejich použití je omezeno jen na jednoduché podobnostní dotazy. V této práci navrhujeme nový dotazovací jazyk, který umožňuje formulovat podobnostní dotazy rozšiřitelným způsobem a bere v úvahu funkcionalitu nabízenou konkrétním vyhledavačem, nad kterým je provozován. Jazyk je postaven nad obecným datovým modelem a abstraktní množinou operací, což umožňuje formulovat nejrůznější pokročilé podobnostní dotazy. Jazyk byl primárně navržen pro použití s frameworkem MESSIF, ale může být využit i jinými vyhledávacími systémy.

Návaznosti

GAP103/10/0886, projekt VaV

Název: Vizuální vyhledávání obrázků na Webu (Akronym: VisualWeb)

Investor: Grantová agentura ČR, Vizuální vyhledávání obrázků na Webu

GD102/09/H042, projekt VaV

Název: Matematické a inženýrské metody pro vývoj spolehlivých a bezpečných paralelních a distribuovaných počítačových systémů

Investor: Grantová agentura ČR, Matematické a inženýrské metody pro vývoj spolehlivých a bezpečných paralelních a distribuovaných počítačových systémů

Podrobný výpis o publikaci