2013
PPP-Codes: Similarity Search Index
NOVÁK, DavidZákladní údaje
Originální název
PPP-Codes: Similarity Search Index
Název česky
Podobnostní index PPP-Codes
Autoři
NOVÁK, David (203 Česká republika, garant, domácí)
Vydání
2013
Další údaje
Jazyk
angličtina
Typ výsledku
Software
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Kód RIV
RIV/00216224:14330/13:00065750
Organizační jednotka
Fakulta informatiky
Klíčová slova česky
PPP-Codes; podobnostní vyhledávání; metrický prostor; index
Klíčová slova anglicky
PPP-Codes; similarity search; metric space; index
Technické parametry
Pro využití softwaru je nutné postupovat podle licence GNU GPL. Odpovědná osoba pro jednání: David Novák, Fakulta informatiky, Masarykova univerzita, Botanická 68a, Brno, 602 00, david.novak@fi.muni.cz, tel. 549495062
Štítky
Příznaky
Mezinárodní význam
Změněno: 17. 7. 2014 14:48, RNDr. David Novák, Ph.D.
Anotace
V originále
Many current applications need to organize data with respect to mutual similarity between data objects (for instance biometric systems). A typical general strategy to retrieve the most similar objects to a given example is to access and then refine a candidate set of objects; the overall search costs (and search time) then typically correlate with the candidate set size. The PPP-Codes index provides a generic approach that combines several independent indexes by aggregating their candidate sets in such a way that the resulting candidate set can be one or two orders of magnitude smaller (while keeping the answer quality). This achievement comes at the expense of higher computational costs of the ranking algorithm but our experiments on various datasets indicate that the overall gain can be significant, especially for data types with large objects or expensive similarity function such as biometric systems.
Návaznosti
VG20122015073, projekt VaV |
|