D 2008

The Development of a Complex-Structured Lexicon based on WordNet

HORÁK, Aleš, Piek VOSSEN a Adam RAMBOUSEK

Základní údaje

Originální název

The Development of a Complex-Structured Lexicon based on WordNet

Název česky

Vývoj komplexně strukturovaného lexikonu založeného na WordNetu

Autoři

HORÁK, Aleš (203 Česká republika, garant), Piek VOSSEN (528 Nizozemské království) a Adam RAMBOUSEK (203 Česká republika)

Vydání

Szeged, Proceedings of the Fourth Global WordNet Conference, od s. 200-208, 9 s. 2008

Nakladatel

University of Szeged

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Maďarsko

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/08:00025715

Organizační jednotka

Fakulta informatiky

ISBN

978-963-482-854-9

UT WoS

000272081100016

Klíčová slova anglicky

Cornetto project; WordNet; DEB platform; DEBVisDic

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 14. 2. 2010 09:15, RNDr. Adam Rambousek, Ph.D.

Anotace

V originále

The Cornetto project develops a new complex-structured lexicon for the Dutch language. The lexicon comprises information from two current electronic dictionaries - the Referentie Bestand Nederlands (RBN), which contains FrameNet-like structures, and the Dutch WordNet (DWN) with the usual WordNet structures. The Cornetto lexicon (stored in the Cornetto database) will be linked to English WordNet synsets and have detailed descriptions of lexical items in terms of morphologic, syntactic, combinatoric and semantic information. The database is organized in four data collections - lexical units, synsets, ontology terms and the Cornetto identifiers. The Cornetto identifiers are specifically used for managing the relations between lexical units on the one hand and synsets on the other hand. The mapping is first created automatically, but then revised manually by lexicographers. Special interfaces have been developed to compare the different perspectives of organizing concepts (lexical units versus synsets versus ontology terms). In this article, we describe the background information about the Cornetto project and the implementation of necessary project tools that are based on the DEBVisDic tool for WordNet editing. The development of the Cornetto clients is a joint project of the Masaryk University in Brno and the University of Amsterdam.

Česky

V projektu Cornetto je vyvíjen nový komplexně strukturovaný lexikon holandštiny. Lexikon spojuje informace ze dvou elektronických slovníků - Referentie Bestand Nederlands (RBN) a Dutch WordNet (DWN). Lexikon Cornetto bude navázán na synsety anglického WordNetu a bude obsahovat podrobný popis lexikálních jednotek (morfologické, syntaktické a sémantické informace). Databáze je rozdělena do čtyř částí - lexikální jednotky, synsety, ontologie a Cornetto identifikátory. Cornetto identifikátory slouží k propojení synsetů a lexikálních jednotek, nejprve jsou vytvořeny automaticky, později manuálně upravovány. Pro práci se slovníky bylo vytvořeno speciální uživatelské rozhraní. Článek popisuje implementaci nástrojů, založených na editoru DEBVisDic. Vývoj software pro Cornetto je společným projektem Masarykovy Univerzity a University of Amsterdam.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce