D 2008

Semi-automatic Linking of New Czech Synsets Using Princeton WordNet

NĚMČÍK, Václav, Karel PALA a Dana HLAVÁČKOVÁ

Základní údaje

Originální název

Semi-automatic Linking of New Czech Synsets Using Princeton WordNet

Název česky

Poloautomatické zavěšování nových českých synetů pomocí Princeton WordNetu

Autoři

NĚMČÍK, Václav (203 Česká republika, garant), Karel PALA (203 Česká republika) a Dana HLAVÁČKOVÁ (203 Česká republika)

Vydání

Warszawa, Intelligent Information Systems XVI, Proceedings of the International IIS'08 Conference, od s. 369-374, 6 s. 2008

Nakladatel

Academic Publishing House EXIT

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Stát vydavatele

Polsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/08:00024227

Organizační jednotka

Fakulta informatiky

ISBN

978-83-60434-44-4

Klíčová slova anglicky

WordNet; Verbalex; Czech; linking; translation; dictionary

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 7. 11. 2008 12:04, Mgr. Václav Němčík

Anotace

V originále

In this paper we discuss extending Czech WordNet with verb synsets coming from the Verbalex database of Czech valency frames. One of the main tasks involved is linking newly added verb synsets to their Czech hypernyms and their English counterparts in Princeton WordNet. To spare the human lexicographers from tedious work, and to make the task more efficient, we have developed WordNet Assistant, a software tool that helps locate the relevant synset(s) in the already existing structures. According to our experience so far, this tool is of great advantage when incorporating new synsets to Czech WordNet, and we regard it as a worthwhile facility when extending WordNets also for other languages.

Česky

Tento příspěvek se týká rozšiřování českého WordNetu o synsety obsažené v databázi českých valenčních rámců Verbalex. V této souvislosti je jedním z hlavních cílů zavěsit nově přidávané synsety k jejich hyperonymům a přiřadit k nim odpovídající synsety v anglickém Princeton WordNetu. Abychom ušetřili lexikografům rutinní úkony a zefektivnili jejich práci, vyvinuli jsme WordNet Asistenta, softwarový nástroj, který pomáhá nalézt relevantní synset(y) v již existujících datových strukturách. Tento nástroj představuje dle našich zkušeností významné usnadnění práce při začleňování nových synsetů do českého WordNetu a domníváme se, že bude vítanou pomocí při rozšiřování WordNetů pro další jazyky.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET100300419, projekt VaV
Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce