D 2008

The Development of a Complex-Structured Lexicon based on WordNet

HORÁK, Aleš; Piek VOSSEN and Adam RAMBOUSEK

Basic information

Original name

The Development of a Complex-Structured Lexicon based on WordNet

Name in Czech

Vývoj komplexně strukturovaného lexikonu založeného na WordNetu

Authors

HORÁK, Aleš (203 Czech Republic, guarantor); Piek VOSSEN (528 Netherlands) and Adam RAMBOUSEK (203 Czech Republic)

Edition

Szeged, Proceedings of the Fourth Global WordNet Conference, p. 200-208, 9 pp. 2008

Publisher

University of Szeged

Other information

Language

English

Type of outcome

Proceedings paper

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Hungary

Confidentiality degree

is not subject to a state or trade secret

References:

RIV identification code

RIV/00216224:14330/08:00025715

Organization unit

Faculty of Informatics

ISBN

978-963-482-854-9

UT WoS

000272081100016

Keywords in English

Cornetto project; WordNet; DEB platform; DEBVisDic

Tags

International impact, Reviewed
Changed: 14/2/2010 09:15, RNDr. Adam Rambousek, Ph.D.

Abstract

V originále

The Cornetto project develops a new complex-structured lexicon for the Dutch language. The lexicon comprises information from two current electronic dictionaries - the Referentie Bestand Nederlands (RBN), which contains FrameNet-like structures, and the Dutch WordNet (DWN) with the usual WordNet structures. The Cornetto lexicon (stored in the Cornetto database) will be linked to English WordNet synsets and have detailed descriptions of lexical items in terms of morphologic, syntactic, combinatoric and semantic information. The database is organized in four data collections - lexical units, synsets, ontology terms and the Cornetto identifiers. The Cornetto identifiers are specifically used for managing the relations between lexical units on the one hand and synsets on the other hand. The mapping is first created automatically, but then revised manually by lexicographers. Special interfaces have been developed to compare the different perspectives of organizing concepts (lexical units versus synsets versus ontology terms). In this article, we describe the background information about the Cornetto project and the implementation of necessary project tools that are based on the DEBVisDic tool for WordNet editing. The development of the Cornetto clients is a joint project of the Masaryk University in Brno and the University of Amsterdam.

In Czech

V projektu Cornetto je vyvíjen nový komplexně strukturovaný lexikon holandštiny. Lexikon spojuje informace ze dvou elektronických slovníků - Referentie Bestand Nederlands (RBN) a Dutch WordNet (DWN). Lexikon Cornetto bude navázán na synsety anglického WordNetu a bude obsahovat podrobný popis lexikálních jednotek (morfologické, syntaktické a sémantické informace). Databáze je rozdělena do čtyř částí - lexikální jednotky, synsety, ontologie a Cornetto identifikátory. Cornetto identifikátory slouží k propojení synsetů a lexikálních jednotek, nejprve jsou vytvořeny automaticky, později manuálně upravovány. Pro práci se slovníky bylo vytvořeno speciální uživatelské rozhraní. Článek popisuje implementaci nástrojů, založených na editoru DEBVisDic. Vývoj software pro Cornetto je společným projektem Masarykovy Univerzity a University of Amsterdam.

Links

LC536, research and development project
Name: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
2C06009, research and development project
Name: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing)
Investor: Ministry of Education, Youth and Sports of the CR