D 2002

A Metric Index for Approximate Text Management

DOHNAL, Vlastislav, Claudio GENNARO and Pavel ZEZULA

Basic information

Original name

A Metric Index for Approximate Text Management

Name in Czech

Metrický index pro podobnostní zpracování textů

Authors

DOHNAL, Vlastislav (203 Czech Republic), Claudio GENNARO (380 Italy) and Pavel ZEZULA (203 Czech Republic, guarantor)

Edition

Anaheim - Calgary - Zurich, Information Systems and Databases, p. 37-42, 2002

Publisher

ACTA Press

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

10000 1. Natural Sciences

Country of publisher

Japan

Confidentiality degree

není předmětem státního či obchodního tajemství

RIV identification code

RIV/00216224:14330/02:00006447

Organization unit

Faculty of Informatics

ISBN

0-88986-362-8

Keywords in English

metric data; similarity search; index structures; similarity join

Tags

International impact, Reviewed
Změněno: 22/10/2010 16:10, doc. RNDr. Vlastislav Dohnal, Ph.D.

Abstract

V originále

Text collections of data need not only search support for identical objects, but approximate matching is even more important. A suitable metric for such a task is the edit distance measure. However, the quadratic complexity of the edit distance prevents from applying storage organizations such as the sequential search. We have investigated the properties of the D-index to approximate searching and matching of text databases.

In Czech

Zpracování textových dat nevyžaduje pouze vyhledání identických objektů, ale také podobnostní hledání. Vhodnou metrikou pro podobnostní hledání v textech je editační vzdálenost, jejíž výpočetní náročnost vylučuje použití souborových organizací typu sekvenční soubor. Pro podobnostní hledání v textech aplikujeme strukturu D-Index a zkoumáme její vlastnosti.

Links

MSM 143300004, plan (intention)
Name: Digitální knihovny
Investor: Ministry of Education, Youth and Sports of the CR, Digital libraries