JAKUBÍČEK, Miloš, Emma ROMANI, Pavel RYCHLÝ a Ondřej HERMAN. Development of HAMOD: a High Agreement Multi-lingual Outlier Detection dataset. In Horák, Rychlý, Rambousek. Recent Advances in Slavonic Natural Language Processing (RASLAN 2021). Brno: Tribun EU. s. 177-183. ISBN 978-80-263-1670-1. 2021.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Development of HAMOD: a High Agreement Multi-lingual Outlier Detection dataset
Autoři JAKUBÍČEK, Miloš (203 Česká republika, garant, domácí), Emma ROMANI (380 Itálie, domácí), Pavel RYCHLÝ (203 Česká republika, domácí) a Ondřej HERMAN (203 Česká republika, domácí).
Vydání Brno, Recent Advances in Slavonic Natural Language Processing (RASLAN 2021), od s. 177-183, 7 s. 2021.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10200 1.2 Computer and information sciences
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW Domovská stránka workshopu Full text PDF
Kód RIV RIV/00216224:14330/21:00123255
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-1670-1
ISSN 2336-4289
Klíčová slova anglicky HAMOD; Distributional thesaurus; Outlier detection; Word embeddings; Sketch Engine
Změnil Změnil: RNDr. Miloš Jakubíček, Ph.D., učo 172962. Změněno: 22. 10. 2023 01:48.
Anotace
In this paper we describe further development of a High Agreement Multi- lingual Outlier Detection dataset (HAMOD) outlier that is used for the purpose of evaluation of automatic distributional thesauri. We briefly introduce the task and methodological motivation for developing such a dataset, then we present the current status of the dataset and related tools as well as results measured on the dataset so far (both in terms of agreement rates and thesauri eveluation). Finally we discuss future developments of HAMOD.
Návaznosti
LM2018101, projekt VaVNázev: Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy (Akronym: LINDAT/CLARIAH-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy
VytisknoutZobrazeno: 18. 4. 2024 13:56