SOJKA, Petr a Vít NOVOTNÝ. Semantically Coherent Vector Space Representations. 2019.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Semantically Coherent Vector Space Representations
Autoři SOJKA, Petr (203 Česko, garant, domácí) a Vít NOVOTNÝ (203 Česko, domácí).
Vydání 2019.
Další údaje
Originální jazyk angličtina
Typ výsledku Prezentace na konferencích
Obor 10200 1.2 Computer and information sciences
Stát vydavatele Česko
Utajení není předmětem státního či obchodního tajemství
WWW PDF Scientific poster
Kód RIV RIV/00216224:14330/19:00109517
Organizační jednotka Fakulta informatiky
Klíčová slova česky umělá inteligence; strojové učení; výpočetní lingvistika; získávání znalostí; učení reprezentace; slovní embeddingy; formal concept analysis; word2vec; word2bits
Klíčová slova anglicky artificial intelligence; machine learning; computational linguistics; information retrieval; representation learning; word embeddings; formal concept analysis; transfer learning; word2vec; word2bits
Štítky machine learning
Příznaky Mezinárodní význam
Změnil Změnil: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Změněno: 9. 1. 2020 11:26.
Anotace

Our work is a scientific poster that was presented at the ML Prague 2019 conference during February 22–24, 2019.

Content is king (Gates, 1996). Decomposition of word semantics matters (Mikolov, 2013). Decomposition of a sentence, paragraph, and document semantics into semantically coherent vector space representations matters, too. Interpretability of these learned vector spaces is the holy grail of natural language processing today, as it would allow accurate representation of thoughts and plugging-in inference into the game.

We will show recent results of our attempts towards this goal by showing how decomposition of document semantics could improve the query answering, performance, and “horizontal transfer learning” based on word2bits could be achieved.

Word representation in the form of binary features allows to use word lattice representation for feature inference by the well studied formal concept analysis theory, and for precise semantic similarity metric based on discriminative features. Also, the incremental learning of word features allows to interpret and infer on them, targeting the holy grail.

Návaznosti
MUNI/A/1145/2018, interní kód MUNázev: Aplikovaný výzkum na FI: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, techniky pro zpracování a vizualizaci velkých dat a rozšířená realita.
Investor: Masarykova univerzita, Grantová agentura MU, Kategorie A - Specifický výzkum - Studentské výzkumné projekty
Typ Název Vložil/a Vloženo Práva
mlprague-2019-semantic_representations.pdf   Verze souboru Novotný, V. 24. 4. 2019

Práva

Právo číst
 
Právo vkládat
 
Právo spravovat
  • osoba doc. RNDr. Petr Sojka, Ph.D., učo 2378
  • osoba RNDr. Vít Novotný, učo 409729
Atributy
 
Vytisknout
Požádat autora o autorský výtisk Zobrazeno: 14. 7. 2020 18:51