2007
Slovotvorné vztahy v českém WordNetu
PALA, Karel a Dana HLAVÁČKOVÁZákladní údaje
Originální název
Slovotvorné vztahy v českém WordNetu
Název anglicky
Derivational Relations in Czech WordNet
Autoři
PALA, Karel a Dana HLAVÁČKOVÁ
Vydání
Gramatika a korpus, 2007
Další údaje
Jazyk
čeština
Typ výsledku
Konferenční abstrakt
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Označené pro přenos do RIV
Ano
Kód RIV
RIV/00216224:14330/07:00024137
Organizační jednotka
Fakulta informatiky
ISBN
80-86496-35-X
Klíčová slova anglicky
Czech WordNet; derivational morphology; derivational relations; automatic morhological analysis
Štítky
Příznaky
Mezinárodní význam
Změněno: 23. 6. 2009 13:33, Mgr. Dana Hlaváčková, Ph.D.
V originále
V článku popisujeme obohacení českého WordNetu o derivační vztahy tvořící slovotvorná hnízda nebo (v jiné terminologii) sémantické podsítě. Derivační vztahy v češtině jsou natolik pravidelné, že je můžeme přidat do českého WordNetu téměř automaticky. K získání slovotvorných hnízd využíváme derivační verze morfologického analyzátoru Ajka, který v sobě obsahuje formální pravidla popisující základní a produktivní slovotvorné vztahy. Dále pracujeme s nástrojem, derivačním webovým rozhraním, které umožňuje získávat dvojice fundující : fundovaný na velkých souborech dat. To umožňuje poloautomaticky odvozovat potřebné tvary pomocí substantivních derivačních sufixů a slovesných prefixů a na tomto základě pak lze vhodně rozhodovat o sémantické povaze jednotlivých derivací. Zatím jsme zpracovali cca 22 českých substantivních derivačních sufixů a cca 16 slovesných prefixů, dospěli jsme tu k souboru 14 derivačních vztahů, které jsou charakterizovány sémanticky, přičemž použité značkování zachycuje sémantické kategorie vyjadřované jednotlivými derivačními vztahy, i když v některých případech rozdíly mezi nimi spočívají jen v přináležitosti ke slovnímu druhu.
Anglicky
In the paper we describe enriching Czech WordNet with the derivational relations that in highly inflectional languages like Czech form typical derivational nests (or subnets). Derivational relations are mostly of semantic nature and their regularity in Czech allows us to add them to the WordNet almost automatically. For this purpose we have used the derivational version of morphological analyzer Ajka that is able to handle the basic and most productive derivational relations in Czech. Using a special derivational interface developed in our NLP Lab we explored the functional load of the selected noun derivational suffixes (22) and established a set of the semantically labeled derivational relations, presently 14.
Návaznosti
| GA201/05/2781, projekt VaV |
| ||
| LC536, projekt VaV |
| ||
| 1ET100300419, projekt VaV |
| ||
| 2C06009, projekt VaV |
|