Query Language for Complex Similarity Queries
BUDÍKOVÁ, Petra, Michal BATKO and Pavel ZEZULA. Query Language for Complex Similarity Queries. Online. 2012, [citováno 2024-04-24] |
Other formats:
BibTeX
LaTeX
RIS
|
Basic information | |
---|---|
Original name | Query Language for Complex Similarity Queries |
Authors | BUDÍKOVÁ, Petra (203 Czech Republic, guarantor, belonging to the institution), Michal BATKO (203 Czech Republic, belonging to the institution) and Pavel ZEZULA (203 Czech Republic, belonging to the institution) |
Edition | 2012. |
Other information | |
---|---|
Original language | English |
Type of outcome | Special-purpose publication |
Field of Study | 10201 Computer sciences, information science, bioinformatics |
Country of publisher | Czech Republic |
Confidentiality degree | is not subject to a state or trade secret |
RIV identification code | RIV/00216224:14330/12:00057425 |
Organization unit | Faculty of Informatics |
Keywords in English | query language; SQL; similarity search |
Tags | DISA |
Changed by | Changed by: RNDr. Michal Batko, Ph.D., učo 2907. Changed: 9/4/2013 14:49. |
Abstract |
---|
For complex data types such as multimedia, traditional data management methods are not suitable. Instead of attribute matching approaches, access methods based on object similarity are becoming popular. Recently, this resulted in an intensive research of indexing and searching methods for the similarity-based retrieval. Nowadays, many efficient methods are already available, but using them to build an actual search system still requires specialists that tune the methods and build the system manually. Several attempts have already been made to provide a more convenient high-level interface in a form of query languages for such systems, but these are limited to support only basic similarity queries. In this paper, we propose a new language that allows to formulate content-based queries in a exible way, taking into account the functionality offered by a particular search engine in use. To ensure this, the language is based on a general data model with an abstract set of operations. Consequently, the language supports various advanced query operations such as similarity joins, reverse nearest neighbor queries, or distinct kNN queries, as well as multi-object and multi-modal queries. The language is primarily designed to be used with the MESSIF framework for content-based searching but can be employed by other retrieval systems as well. |
Abstract (in Czech) |
---|
Tradiční metody pro správu atributových dat nejsou vhodné pro složité datové typy, jakými jsou například multimédia. Taková data jsou stále častěji organizována a prohledávána pomocí vnitřní podobnosti obsahu. V minulých letech byly intenzivně zkoumány metody umožňující efektivně indexovat a prohledávat data na základě podobnosti, a v současnosti již existují fungující systémy využívající tohoto principu. Jejich použití však vyžaduje pokročilé znalosti. Existují i první nástroje, které mají poskytnout intuitivní rozhraní k takovým systémům, ale jejich použití je omezeno jen na jednoduché podobnostní dotazy. V této práci navrhujeme nový dotazovací jazyk, který umožňuje formulovat podobnostní dotazy rozšiřitelným způsobem a bere v úvahu funkcionalitu nabízenou konkrétním vyhledavačem, nad kterým je provozován. Jazyk je postaven nad obecným datovým modelem a abstraktní množinou operací, což umožňuje formulovat nejrůznější pokročilé podobnostní dotazy. Jazyk byl primárně navržen pro použití s frameworkem MESSIF, ale může být využit i jinými vyhledávacími systémy. |
Links | |
---|---|
GAP103/10/0886, research and development project | Name: Vizuální vyhledávání obrázků na Webu (Acronym: VisualWeb) |
Investor: Czech Science Foundation, Content-based Image Retrieval on the Web Scale | |
GD102/09/H042, research and development project | Name: Matematické a inženýrské metody pro vývoj spolehlivých a bezpečných paralelních a distribuovaných počítačových systémů |
Investor: Czech Science Foundation |
PrintDisplayed: 24/4/2024 05:52