NÁLEPA, Filip, Michal BATKO a Pavel ZEZULA. Enhancing Similarity Search Throughput by Dynamic Query Reordering. In Hartmann, Sven and Ma, Hui. Database and Expert Systems Applications: 27th International Conference, DEXA 2016, Porto, Portugal, September 5-8, 2016, Proceedings, Part II. Cham: Springer International Publishing, 2016, s. 185-200. ISBN 978-3-319-44405-5. Dostupné z: https://dx.doi.org/10.1007/978-3-319-44406-2_14.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Enhancing Similarity Search Throughput by Dynamic Query Reordering
Autoři NÁLEPA, Filip (203 Česká republika, garant, domácí), Michal BATKO (203 Česká republika, domácí) a Pavel ZEZULA (203 Česká republika, domácí).
Vydání Cham, Database and Expert Systems Applications: 27th International Conference, DEXA 2016, Porto, Portugal, September 5-8, 2016, Proceedings, Part II, od s. 185-200, 16 s. 2016.
Nakladatel Springer International Publishing
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Portugalsko
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
Impakt faktor Impact factor: 0.402 v roce 2005
Kód RIV RIV/00216224:14330/16:00088102
Organizační jednotka Fakulta informatiky
ISBN 978-3-319-44405-5
ISSN 0302-9743
Doi http://dx.doi.org/10.1007/978-3-319-44406-2_14
UT WoS 000389020200014
Klíčová slova anglicky Stream processing; Similarity Search
Štítky DISA, firank_B
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 13. 5. 2020 19:24.
Anotace
A lot of multimedia data are being created nowadays, which can only be searched by content since no searching metadata are available for them. To make the content search efficient, similarity indexing structures based on the metric-space model can be used. In our work, we focus on a scenario where the similarity search is used in the context of stream processing. In particular, there is a potentially infinite sequence (stream) of query objects, and a query needs to be executed for each of them. The goal is to maximize the throughput of processed queries while maintaining an acceptable delay. We propose an approach based on dynamic reordering of the incoming queries combined with caching of recent results. We were able to achieve up to 3.7 times higher throughput compared to the base case when no reordering and caching is used.
Návaznosti
GA16-18889S, projekt VaVNázev: Analytika pro velká nestrukturovaná data (Akronym: Big Data Analytics for Unstructured Data)
Investor: Grantová agentura ČR, Big Data Analytics for Unstructured Data
VytisknoutZobrazeno: 9. 5. 2024 09:07