NOVÁK, David a Pavel ZEZULA. Performance Study of Independent Anchor Spaces for Similarity Searching. Online. The Computer Journal. Oxford, UK: Oxford University Press, 2014, roč. 57, č. 11, s. 1741-1755. ISSN 0010-4620. Dostupné z: https://dx.doi.org/10.1093/comjnl/bxt114. [citováno 2024-04-23]
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Performance Study of Independent Anchor Spaces for Similarity Searching
Autoři NOVÁK, David (203 Česká republika, garant, domácí) a Pavel ZEZULA (203 Česká republika, domácí)
Vydání The Computer Journal, Oxford, UK, Oxford University Press, 2014, 0010-4620.
Další údaje
Originální jazyk angličtina
Typ výsledku Článek v odborném periodiku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Velká Británie a Severní Irsko
Utajení není předmětem státního či obchodního tajemství
WWW publisher site
Impakt faktor Impact factor: 0.787
Kód RIV RIV/00216224:14330/14:00073219
Organizační jednotka Fakulta informatiky
Doi http://dx.doi.org/10.1093/comjnl/bxt114
UT WoS 000344649500011
Klíčová slova anglicky similarity search; metric space; multi-index; efficiency; robustness
Štítky DISA, Metric Space
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. David Novák, Ph.D., učo 4335. Změněno: 8. 1. 2015 15:14.
Anotace
This work targets the problem of search efficiency vs. answer quality of approximate metric-based similarity search. We especially focus on techniques based on recursive Voronoi-like partitioning or, from another perspective, on pivot permutations. These techniques use sets of reference objects (anchors/pivots) to partition the metric space into cells of close data items. Instead of refining the search space by enlarging the anchor set of a single index, we propose to divide a large pivot set into several subsets and build multiple indexes with independent space partitioning; at query time, the overall search costs are also divided among the separate indexes. Our thorough experimental study on three different real datasets uncovers drawbacks of excessive increase of a single pivot set size—such partitioning refinement can be counterproductive beyond a certain number of pivots. Our approach overcomes the root causes of this limitation and increases the answer quality while preserving the search costs. Further, we address the question of robustness of the answer quality, which can be significantly improved by utilization of independent anchor spaces.
Návaznosti
GBP103/12/G084, projekt VaVNázev: Centrum pro multi-modální interpretaci dat velkého rozsahu
Investor: Grantová agentura ČR, Centrum pro multi-modální interpretaci dat velkého rozsahu
VG20122015073, projekt VaVNázev: Efektivní vyhledávání v rozsáhlých biometrických datech (Akronym: EFBIO)
Investor: Ministerstvo vnitra ČR, Efektivní vyhledávání v rozsáhlých biometrických datech
VytisknoutZobrazeno: 23. 4. 2024 12:09