a 2007

Slovotvorné vztahy v českém WordNetu

PALA, Karel a Dana HLAVÁČKOVÁ

Základní údaje

Originální název

Slovotvorné vztahy v českém WordNetu

Název anglicky

Derivational Relations in Czech WordNet

Autoři

PALA, Karel a Dana HLAVÁČKOVÁ

Vydání

Gramatika a korpus, 2007

Další údaje

Jazyk

čeština

Typ výsledku

Konferenční abstrakt

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/07:00024137

Organizační jednotka

Fakulta informatiky

ISBN

80-86496-35-X

Klíčová slova anglicky

Czech WordNet; derivational morphology; derivational relations; automatic morhological analysis

Příznaky

Mezinárodní význam
Změněno: 23. 6. 2009 13:33, Mgr. Dana Hlaváčková, Ph.D.

Anotace

V originále

V článku popisujeme obohacení českého WordNetu o derivační vztahy tvořící slovotvorná hnízda nebo (v jiné terminologii) sémantické podsítě. Derivační vztahy v češtině jsou natolik pravidelné, že je můžeme přidat do českého WordNetu téměř automaticky. K získání slovotvorných hnízd využíváme derivační verze morfologického analyzátoru Ajka, který v sobě obsahuje formální pravidla popisující základní a produktivní slovotvorné vztahy. Dále pracujeme s nástrojem, derivačním webovým rozhraním, které umožňuje získávat dvojice fundující : fundovaný na velkých souborech dat. To umožňuje poloautomaticky odvozovat potřebné tvary pomocí substantivních derivačních sufixů a slovesných prefixů a na tomto základě pak lze vhodně rozhodovat o sémantické povaze jednotlivých derivací. Zatím jsme zpracovali cca 22 českých substantivních derivačních sufixů a cca 16 slovesných prefixů, dospěli jsme tu k souboru 14 derivačních vztahů, které jsou charakterizovány sémanticky, přičemž použité značkování zachycuje sémantické kategorie vyjadřované jednotlivými derivačními vztahy, i když v některých případech rozdíly mezi nimi spočívají jen v přináležitosti ke slovnímu druhu.

Anglicky

In the paper we describe enriching Czech WordNet with the derivational relations that in highly inflectional languages like Czech form typical derivational nests (or subnets). Derivational relations are mostly of semantic nature and their regularity in Czech allows us to add them to the WordNet almost automatically. For this purpose we have used the derivational version of morphological analyzer Ajka that is able to handle the basic and most productive derivational relations in Czech. Using a special derivational interface developed in our NLP Lab we explored the functional load of the selected noun derivational suffixes (22) and established a set of the semantically labeled derivational relations, presently 14.

Návaznosti

GA201/05/2781, projekt VaV
Název: Překlad českých vět do konstrukcí transparentní intenzionální logiky
Investor: Grantová agentura ČR, Překlad českých vět do konstrukcí transparentní intenzionální logiky
LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET100300419, projekt VaV
Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce