D 2021

Development of HAMOD: a High Agreement Multi-lingual Outlier Detection dataset

JAKUBÍČEK, Miloš, Emma ROMANI, Pavel RYCHLÝ a Ondřej HERMAN

Základní údaje

Originální název

Development of HAMOD: a High Agreement Multi-lingual Outlier Detection dataset

Autoři

JAKUBÍČEK, Miloš (203 Česká republika, garant, domácí), Emma ROMANI (380 Itálie, domácí), Pavel RYCHLÝ (203 Česká republika, domácí) a Ondřej HERMAN (203 Česká republika, domácí)

Vydání

Brno, Recent Advances in Slavonic Natural Language Processing (RASLAN 2021), od s. 177-183, 7 s. 2021

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14330/21:00123255

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1670-1

ISSN

Klíčová slova anglicky

HAMOD; Distributional thesaurus; Outlier detection; Word embeddings; Sketch Engine
Změněno: 15. 5. 2024 10:24, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

In this paper we describe further development of a High Agreement Multi- lingual Outlier Detection dataset (HAMOD) outlier that is used for the purpose of evaluation of automatic distributional thesauri. We briefly introduce the task and methodological motivation for developing such a dataset, then we present the current status of the dataset and related tools as well as results measured on the dataset so far (both in terms of agreement rates and thesauri eveluation). Finally we discuss future developments of HAMOD.

Návaznosti

LM2018101, projekt VaV
Název: Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy (Akronym: LINDAT/CLARIAH-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy