HERMAN, Ondřej, Vojtěch KOVÁŘ, Miloš JAKUBÍČEK a Pavel RYCHLÝ. Word Sense Induction Using Word Sketches. In Martín-Vide C., Purver M., Pollak S. Proceedings of the 7th International Conference on Statistical Language and Speech Processing. Cham: Springer, 2019, s. 83-91. ISBN 978-3-030-31371-5. Dostupné z: https://dx.doi.org/10.1007/978-3-030-31372-2_7.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Word Sense Induction Using Word Sketches
Autoři HERMAN, Ondřej (203 Česká republika, garant, domácí), Vojtěch KOVÁŘ (203 Česká republika), Miloš JAKUBÍČEK (203 Česká republika) a Pavel RYCHLÝ (203 Česká republika).
Vydání Cham, Proceedings of the 7th International Conference on Statistical Language and Speech Processing, od s. 83-91, 9 s. 2019.
Nakladatel Springer
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10200 1.2 Computer and information sciences
Stát vydavatele Švýcarsko
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
Impakt faktor Impact factor: 0.402 v roce 2005
Kód RIV RIV/00216224:14330/19:00107596
Organizační jednotka Fakulta informatiky
ISBN 978-3-030-31371-5
ISSN 0302-9743
Doi http://dx.doi.org/10.1007/978-3-030-31372-2_7
Klíčová slova anglicky Word sense induction;Word sketch;Collocations;Word embeddings
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Miloš Jakubíček, Ph.D., učo 172962. Změněno: 22. 10. 2023 01:49.
Anotace
We present three methods for word sense induction based on Word Sketches. The methods are being developed a part of an semiautomatic dictionary creation system, providing annotators with the summarized semantic behavior of a word. Two of the methods are based on the assumption of a word having a single sense per collocation. We cluster the Word Sketch based collocations by their co-occurrence behavior in the first method. The second method clusters the collocations using word embedding model. The last method is based on clustering of Word Sketch thesauri. We evaluate the methods and demonstrate their behavior on representative words.
Návaznosti
EF16_013/0001781, projekt VaVNázev: LINDAT/CLARIN - Výzkumná infrastruktura pro jazykové technologie - rozšíření repozitáře a výpočetní kapacity
GA18-23891S, projekt VaVNázev: Hyperintensionální usuzování nad texty přirozeného jazyka
Investor: Grantová agentura ČR, Hyperintensionální usuzování nad texty přirozeného jazyka
LM2015071, projekt VaVNázev: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
MUNI/A/1018/2018, interní kód MUNázev: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VIII.
Investor: Masarykova univerzita, Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VIII., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
VytisknoutZobrazeno: 26. 4. 2024 21:27