Závěrečná práce: Marek Petrovič: One Bit at a Time: Impact of Quantisation on Neural Machine Translation
Diplomová práce
One Bit at a Time: Impact of Quantisation on Neural Machine Translation
Anotace
Napriek svojej presnosti, nasadenie veľkých neurónových jazykových modelov stále čelí niekoľkým praktickým problémom. Okrem vysokej pamäťovej náročnosti, hlavnou prekážkou je rýchlosť predikcie. V prípade generatívnych modelov, čas auto-regresívneho generovania škáluje s dĺžkou výstupu. Ďalšie významné obmedzenie prekladových modelov je ich doménová špecificita, ktorá je daná doménou tréningových dát …více
Abstract
Despite the precision of the large language models, the deployment of these models still faces some practical issues. Except for being memory-demanding, the main issue lies in the speed of prediction. In the case of generative language models, the time of auto-regressive generation scales with the output length. Another significant limitation of translation models remains in their domain-specificity …více
Zadání práce
19. 5. 2022 13:06, Mgr. Michal Štefánik, Ph.D., učo 422237
Konzultant
Práce na příbuzné téma
Seznam prací, které mají shodná klíčová slova.
-
Speeding up inference time of neural machine translation
Mgr. Martin Geletka, učo 456576 -
Transformer Neural Networks for Natural Language Processing
Jonáš Konečný -
Pretraining and Evaluation of Czech ALBERT Language Model
RNDr. Petr Zelina, učo 469366 -
Machine translation in a specific domain
Mgr. Tereza Vrabcová, učo 485431 -
Prediction of missing peaks in mass spectra
Bc. Michal Starý -
Utilisation of language representations for Information Retrieval
Ing. Petr Mička -
Optimization techniques of neural networks for mobile platforms during training phase
Ing. Adam Grygar -
Histopathology analysis using Vision Transformers
Mgr. Tomáš Repák




