D 2012

Migrating Cornetto Lexicon to New XML Database Engine

HORÁK, Aleš a Adam RAMBOUSEK

Základní údaje

Originální název

Migrating Cornetto Lexicon to New XML Database Engine

Název česky

Migrace lexikonu Cornetto na novou XML databázi

Vydání

Matsue, Japan, 6th International Global Wordnet Conference Proceedings, od s. 305-311, 7 s. 2012

Nakladatel

Toyohashi University of Technology

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Japonsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/12:00057240

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-0244-5

Klíčová slova česky

Cornetto; XML database; DEB platform

Klíčová slova anglicky

Cornetto; XML databáze; platforma DEB

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 12. 4. 2013 13:20, RNDr. Adam Rambousek, Ph.D.

Anotace

V originále

The original Cornetto project started to develop a new complex-structured lexicon for the Dutch language. The lexicon building process works with information from two current electronic dictionaries -- the Referentie Bestand Nederlands (RBN), which contains FrameNet-like structures, and the Dutch wordnet (DWN) with the usual wordnet structures. The resulting Cornetto lexicon is stored in a system called Cornetto database, which is built over the Dictionary Editor and Browser platform. In this paper, we describe a transition of the Cornetto database system to a new database backend based on large set of tests that were run on four selected (out of twenty) available XML database systems. We present the technical details of the Cornetto editing process and the results before and after the database transition.

Česky

Cílem projektu Cornetto bylo vytvořit nový komplexní lexikon nizozemského jazyka. Při tvorbě lexikonu se pracuje s informace ze dvou existujících elektronických slovníků - Referentie Bestand Nederlands (RBN), který obsahuje struktury podobné FrameNetu, a Dutch Wordnet (DWN) s obvyklou strukturou wordnetu. Výsledný lexikon je uložen v systému nazvaném Cornetto database, který je postaven na platformě Dictionary Editor and Browser (DEB). V článku popisujeme přechod systému Cornetto na novou databázi, která byla vybrána pomocí rozsáhlé sady testů provedených na čtyřech vybraných (z více než dvaceti existujících) XML databázových systémech. Jsou popsány technické podrobnosti editace databáze Cornetto a výsledky srovnávající stav před a po změně databáze.

Návaznosti

GAP401/10/0792, projekt VaV
Název: Temporální aspekty znalostí a informací
Investor: Grantová agentura ČR, Temporální aspekty znalostí a informací
LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
LM2010013, projekt VaV
Název: LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
VF20102014003, projekt VaV
Název: Analýza přirozeného jazyka v prostředí internetu (Akronym: APJI)
Investor: Ministerstvo vnitra ČR, Analýza přirozeného jazyka v prostředí internetu

Přiložené soubory