D 2019

Word Sense Induction Using Word Sketches

HERMAN, Ondřej, Vojtěch KOVÁŘ, Miloš JAKUBÍČEK a Pavel RYCHLÝ

Základní údaje

Originální název

Word Sense Induction Using Word Sketches

Autoři

HERMAN, Ondřej (203 Česká republika, garant, domácí), Vojtěch KOVÁŘ (203 Česká republika), Miloš JAKUBÍČEK (203 Česká republika) a Pavel RYCHLÝ (203 Česká republika)

Vydání

Cham, Proceedings of the 7th International Conference on Statistical Language and Speech Processing, od s. 83-91, 9 s. 2019

Nakladatel

Springer

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Švýcarsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Impakt faktor

Impact factor: 0.402 v roce 2005

Kód RIV

RIV/00216224:14330/19:00107596

Organizační jednotka

Fakulta informatiky

ISBN

978-3-030-31371-5

ISSN

Klíčová slova anglicky

Word sense induction;Word sketch;Collocations;Word embeddings

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 22. 10. 2023 01:49, RNDr. Miloš Jakubíček, Ph.D.

Anotace

V originále

We present three methods for word sense induction based on Word Sketches. The methods are being developed a part of an semiautomatic dictionary creation system, providing annotators with the summarized semantic behavior of a word. Two of the methods are based on the assumption of a word having a single sense per collocation. We cluster the Word Sketch based collocations by their co-occurrence behavior in the first method. The second method clusters the collocations using word embedding model. The last method is based on clustering of Word Sketch thesauri. We evaluate the methods and demonstrate their behavior on representative words.

Návaznosti

EF16_013/0001781, projekt VaV
Název: LINDAT/CLARIN - Výzkumná infrastruktura pro jazykové technologie - rozšíření repozitáře a výpočetní kapacity
GA18-23891S, projekt VaV
Název: Hyperintensionální usuzování nad texty přirozeného jazyka
Investor: Grantová agentura ČR, Hyperintensionální usuzování nad texty přirozeného jazyka
LM2015071, projekt VaV
Název: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
MUNI/A/1018/2018, interní kód MU
Název: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VIII.
Investor: Masarykova univerzita, Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VIII., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty