D 2008

Semi-automatic Linking of New Czech Synsets Using Princeton WordNet

NĚMČÍK, Václav, Karel PALA and Dana HLAVÁČKOVÁ

Basic information

Original name

Semi-automatic Linking of New Czech Synsets Using Princeton WordNet

Name in Czech

Poloautomatické zavěšování nových českých synetů pomocí Princeton WordNetu

Authors

NĚMČÍK, Václav (203 Czech Republic, guarantor), Karel PALA (203 Czech Republic) and Dana HLAVÁČKOVÁ (203 Czech Republic)

Edition

Warszawa, Intelligent Information Systems XVI, Proceedings of the International IIS'08 Conference, p. 369-374, 6 pp. 2008

Publisher

Academic Publishing House EXIT

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Country of publisher

Poland

Confidentiality degree

není předmětem státního či obchodního tajemství

References:

RIV identification code

RIV/00216224:14330/08:00024227

Organization unit

Faculty of Informatics

ISBN

978-83-60434-44-4

Keywords in English

WordNet; Verbalex; Czech; linking; translation; dictionary

Tags

International impact, Reviewed
Změněno: 7/11/2008 12:04, Mgr. Václav Němčík

Abstract

V originále

In this paper we discuss extending Czech WordNet with verb synsets coming from the Verbalex database of Czech valency frames. One of the main tasks involved is linking newly added verb synsets to their Czech hypernyms and their English counterparts in Princeton WordNet. To spare the human lexicographers from tedious work, and to make the task more efficient, we have developed WordNet Assistant, a software tool that helps locate the relevant synset(s) in the already existing structures. According to our experience so far, this tool is of great advantage when incorporating new synsets to Czech WordNet, and we regard it as a worthwhile facility when extending WordNets also for other languages.

In Czech

Tento příspěvek se týká rozšiřování českého WordNetu o synsety obsažené v databázi českých valenčních rámců Verbalex. V této souvislosti je jedním z hlavních cílů zavěsit nově přidávané synsety k jejich hyperonymům a přiřadit k nim odpovídající synsety v anglickém Princeton WordNetu. Abychom ušetřili lexikografům rutinní úkony a zefektivnili jejich práci, vyvinuli jsme WordNet Asistenta, softwarový nástroj, který pomáhá nalézt relevantní synset(y) v již existujících datových strukturách. Tento nástroj představuje dle našich zkušeností významné usnadnění práce při začleňování nových synsetů do českého WordNetu a domníváme se, že bude vítanou pomocí při rozšiřování WordNetů pro další jazyky.

Links

LC536, research and development project
Name: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
1ET100300419, research and development project
Name: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Academy of Sciences of the Czech Republic, Intelligent Models, Algorithms, Methods and Tools for the Semantic Web (realization)
2C06009, research and development project
Name: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing)
Investor: Ministry of Education, Youth and Sports of the CR