D
2002
A Metric Index for Approximate Text Management
DOHNAL, Vlastislav, Claudio GENNARO a Pavel ZEZULA
Základní údaje
Originální název
A Metric Index for Approximate Text Management
Název česky
Metrický index pro podobnostní zpracování textů
Vydání
Anaheim - Calgary - Zurich, Information Systems and Databases, s. 37-42, 2002
Další údaje
Typ výsledku
Stať ve sborníku
Obor
10000 1. Natural Sciences
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/02:00006447
Organizační jednotka
Fakulta informatiky
Klíčová slova anglicky
metric data; similarity search; index structures; similarity join
Příznaky
Mezinárodní význam, Recenzováno
V originále
Text collections of data need not only search support for identical objects, but approximate matching is even more important. A suitable metric for such a task is the edit distance measure. However, the quadratic complexity of the edit distance prevents from applying storage organizations such as the sequential search. We have investigated the properties of the D-index to approximate searching and matching of text databases.
Česky
Zpracování textových dat nevyžaduje pouze vyhledání identických objektů, ale také podobnostní hledání. Vhodnou metrikou pro podobnostní hledání v textech je editační vzdálenost, jejíž výpočetní náročnost vylučuje použití souborových organizací typu sekvenční soubor. Pro podobnostní hledání v textech aplikujeme strukturu D-Index a zkoumáme její vlastnosti.
Návaznosti
MSM 143300004, záměr | Název: Digitální knihovny | Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Digitální knihovny |
|
Zobrazeno: 6. 11. 2024 15:40