Informační systém Masarykovy univerzity 

Performance Study of Independent Anchor Spaces for Similarity Searching

česky | in English

NOVÁK, David a Pavel ZEZULA. Performance Study of Independent Anchor Spaces for Similarity Searching. The Computer Journal, Oxford, UK: Oxford University Press, 2014, roč. 57, č. 11, s. 1741-1755. ISSN 0010-4620. doi:10.1093/comjnl/bxt114.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Performance Study of Independent Anchor Spaces for Similarity Searching
Autoři NOVÁK, David (203 Česká republika, garant, domácí) a Pavel ZEZULA (203 Česká republika, domácí).
Vydání The Computer Journal, Oxford, UK, Oxford University Press, 2014, 0010-4620.
Další údaje
Originální jazyk angličtina
Typ výsledku Článek v odborném periodiku
Obor Informatika
Stát vydavatele Spojené království
Utajení není předmětem státního či obchodního tajemství
WWW publisher site
Impakt faktor Impact factor: 0.787
Kód RIV RIV/00216224:14330/14:00073219
Organizační jednotka Fakulta informatiky
Doi http://dx.doi.org/10.1093/comjnl/bxt114
UT WoS 000344649500011
Klíčová slova anglicky similarity search; metric space; multi-index; efficiency; robustness
Štítky DISA, Metric Space
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. David Novák, Ph.D., učo 4335. Změněno: 8. 1. 2015 15:14.
Anotace
This work targets the problem of search efficiency vs. answer quality of approximate metric-based similarity search. We especially focus on techniques based on recursive Voronoi-like partitioning or, from another perspective, on pivot permutations. These techniques use sets of reference objects (anchors/pivots) to partition the metric space into cells of close data items. Instead of refining the search space by enlarging the anchor set of a single index, we propose to divide a large pivot set into several subsets and build multiple indexes with independent space partitioning; at query time, the overall search costs are also divided among the separate indexes. Our thorough experimental study on three different real datasets uncovers drawbacks of excessive increase of a single pivot set size—such partitioning refinement can be counterproductive beyond a certain number of pivots. Our approach overcomes the root causes of this limitation and increases the answer quality while preserving the search costs. Further, we address the question of robustness of the answer quality, which can be significantly improved by utilization of independent anchor spaces.
Návaznosti
GBP103/12/G084, projekt VaVNázev: Centrum pro multi-modální interpretaci dat velkého rozsahu
Investor: Grantová agentura ČR, Projekty na podporu excelence v základním výzkumu
VG20122015073, projekt VaVNázev: Efektivní vyhledávání v rozsáhlých biometrických datech (Akronym: EFBIO)
Investor: Ministerstvo vnitra ČR, Program bezpečnostního výzkumu České republiky v letech 2010-2015
VytisknoutZobrazeno: 22. 10. 2017 12:11

Relevantní odkazy 


Nahoru | Aktuální datum a čas: 22. 10. 2017 12:11, 42. (sudý) týden

Kontakty: istech(zavináč/atsign)fi(tečka/dot)muni(tečka/dot)cz, studijní odd., správci práv, is-technici, e-technici, IT podpora | Použití cookies | Více o Informačním systému