D 2019

SiLi Index: Data Structure for Fast Vector Space Searching

HERMAN, Ondřej a Pavel RYCHLÝ

Základní údaje

Originální název

SiLi Index: Data Structure for Fast Vector Space Searching

Autoři

HERMAN, Ondřej (203 Česká republika, domácí) a Pavel RYCHLÝ (203 Česká republika, domácí)

Vydání

Brno, Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2019, od s. 111-116, 6 s. 2019

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/19:00111665

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1530-8

ISSN

UT WoS

000604899800013

Klíčová slova anglicky

word embeddings; vector space; semantic similarity
Změněno: 15. 5. 2024 01:31, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Nearest neighbor queries in high-dimensional spaces are ex-pensive. In this article, we propose a method of building and querying astand-alone data structure, SiLi (SimilarityList) Index, which supports ap-proximating the results of k-NN queries in high-dimensional spaces, whileusing a significantly reduced amount of system memory and processortime compared to the usual brute-force search methods.

Návaznosti

LM2015071, projekt VaV
Název: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum