2021
Development of HAMOD: a High Agreement Multi-lingual Outlier Detection dataset
JAKUBÍČEK, Miloš, Emma ROMANI, Pavel RYCHLÝ a Ondřej HERMANZákladní údaje
Originální název
Development of HAMOD: a High Agreement Multi-lingual Outlier Detection dataset
Autoři
JAKUBÍČEK, Miloš (203 Česká republika, garant, domácí), Emma ROMANI (380 Itálie, domácí), Pavel RYCHLÝ (203 Česká republika, domácí) a Ondřej HERMAN (203 Česká republika, domácí)
Vydání
Brno, Recent Advances in Slavonic Natural Language Processing (RASLAN 2021), od s. 177-183, 7 s. 2021
Nakladatel
Tribun EU
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10200 1.2 Computer and information sciences
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Kód RIV
RIV/00216224:14330/21:00123255
Organizační jednotka
Fakulta informatiky
ISBN
978-80-263-1670-1
ISSN
Klíčová slova anglicky
HAMOD; Distributional thesaurus; Outlier detection; Word embeddings; Sketch Engine
Změněno: 15. 5. 2024 10:24, RNDr. Pavel Šmerk, Ph.D.
Anotace
V originále
In this paper we describe further development of a High Agreement Multi- lingual Outlier Detection dataset (HAMOD) outlier that is used for the purpose of evaluation of automatic distributional thesauri. We briefly introduce the task and methodological motivation for developing such a dataset, then we present the current status of the dataset and related tools as well as results measured on the dataset so far (both in terms of agreement rates and thesauri eveluation). Finally we discuss future developments of HAMOD.
Návaznosti
LM2018101, projekt VaV |
|