NOVOTNÝ, Vít, Michal ŠTEFÁNIK, Dávid LUPTÁK a Petr SOJKA. Towards Useful Word Embeddings: Evaluation on Information Retrieval, Text Classification, and Language Modeling. In Aleš Horák and Pavel Rychlý and Adam Rambousek. Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2020. Brno: Tribun EU, 2020. s. 37-46. ISBN 978-80-263-1600-8.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Towards Useful Word Embeddings: Evaluation on Information Retrieval, Text Classification, and Language Modeling
Autoři NOVOTNÝ, Vít (203 Česká republika, garant, domácí), Michal ŠTEFÁNIK (703 Slovensko, domácí), Dávid LUPTÁK (703 Slovensko, domácí) a Petr SOJKA (203 Česká republika, domácí).
Vydání Brno, Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2020, od s. 37-46, 10 s. 2020.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW workshop homepage PDF (fulltext)
Kód RIV RIV/00216224:14330/20:00117105
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-1600-8
ISSN 2336-4289
UT WoS 000655471300004
Klíčová slova česky evaluace; slovní vektory; word2vec; fastText; vyhledávání informací; klasifikace textů; jazykové modelování
Klíčová slova anglicky Evaluation; word vectors; word2vec; fastText; information retrieval; text classification; language modeling
Štítky information retrieval, language modeling, machine learning, SCM, soft cosine measure, text classification, word embeddings
Příznaky Mezinárodní význam
Změnil Změnil: Mgr. Michal Petr, učo 65024. Změněno: 16. 5. 2022 15:08.
Anotace

Since the seminal work of Mikolov et al. (2013), word vectors of log-bilinear models have found their way into many NLP applications and were extended with the positional model.

Although the positional model improves accuracy on the intrinsic English word analogy task, prior work has neglected its evaluation on extrinsic end tasks, which correspond to real-world NLP applications.

In this paper, we describe our first steps in evaluating positional weighting on the information retrieval, text classification, and language modeling extrinsic end tasks.

Návaznosti
MUNI/A/1076/2019, interní kód MUNázev: Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 20 (Akronym: SKOMU)
Investor: Masarykova univerzita, Zapojení studentů Fakulty informatiky do mezinárodní vědecké komunity 20, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
MUNI/A/1411/2019, interní kód MUNázev: Aplikovaný výzkum: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, zpracování přirozeného jazyka a jazykové inženýrství, vizualizaci velkých dat a rozšířená realita.
Investor: Masarykova univerzita, Aplikovaný výzkum: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, zpracování přirozeného jazyka a jazykové inženýrství, vizualizaci velkých dat a rozšířená realita., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
VytisknoutZobrazeno: 12. 8. 2022 07:35