Towards Useful Word Embeddings: Evaluation on Information
Retrieval, Text Classification, and Language Modeling

D 2020

Towards Useful Word Embeddings: Evaluation on Information Retrieval, Text Classification, and Language Modeling

NOVOTNÝ, Vít; Michal ŠTEFÁNIK; Dávid LUPTÁK a Petr SOJKA

Základní údaje

Originální název

Towards Useful Word Embeddings: Evaluation on Information Retrieval, Text Classification, and Language Modeling

Autoři

NOVOTNÝ, Vít; Michal ŠTEFÁNIK; Dávid LUPTÁK a Petr SOJKA

Vydání

Brno, Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2020, od s. 37-46, 10 s. 2020

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

workshop homepage, PDF (fulltext)

Kód RIV

RIV/00216224:14330/20:00117105

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1600-8

ISSN

UT WoS

000655471300004

EID Scopus

2-s2.0-85103646502

Klíčová slova česky

evaluace; slovní vektory; word2vec; fastText; vyhledávání informací; klasifikace textů; jazykové modelování

Klíčová slova anglicky

Evaluation; word vectors; word2vec; fastText; information retrieval; text classification; language modeling

Štítky

information retrieval, language modeling, machine learning, SCM, soft cosine measure, text classification, word embeddings

Příznaky

Mezinárodní význam

Změněno: 16. 5. 2022 15:08, Mgr. Michal Petr

Anotace

V originále

Since the seminal work of Mikolov et al. (2013), word vectors of log-bilinear models have found their way into many NLP applications and were extended with the positional model.

Although the positional model improves accuracy on the intrinsic English word analogy task, prior work has neglected its evaluation on extrinsic end tasks, which correspond to real-world NLP applications.

In this paper, we describe our first steps in evaluating positional weighting on the information retrieval, text classification, and language modeling extrinsic end tasks.

Návaznosti

MUNI/A/1076/2019, interní kód MU

Název: Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 20 (Akronym: SKOMU)

Investor: Masarykova univerzita, Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 20, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty

MUNI/A/1411/2019, interní kód MU

Název: Aplikovaný výzkum: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, zpracování přirozeného jazyka a jazykové inženýrství, vizualizaci velkých dat a rozšířená realita.

Investor: Masarykova univerzita, Aplikovaný výzkum: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, zpracování přirozeného jazyka a jazykové inženýrství, vizualizaci velkých dat a rozšířená realita., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty

Přehled o publikaci