Thesis/Dissertation: Marek Petrovič: One Bit at a Time: Impact of Quantisation on Neural Machine Translation
Master's thesis
One Bit at a Time: Impact of Quantisation on Neural Machine Translation
Abstract
Napriek svojej presnosti, nasadenie veľkých neurónových jazykových modelov stále čelí niekoľkým praktickým problémom. Okrem vysokej pamäťovej náročnosti, hlavnou prekážkou je rýchlosť predikcie. V prípade generatívnych modelov, čas auto-regresívneho generovania škáluje s dĺžkou výstupu. Ďalšie významné obmedzenie prekladových modelov je ich doménová špecificita, ktorá je daná doménou tréningových dát …more
Abstract
Despite the precision of the large language models, the deployment of these models still faces some practical issues. Except for being memory-demanding, the main issue lies in the speed of prediction. In the case of generative language models, the time of auto-regressive generation scales with the output length. Another significant limitation of translation models remains in their domain-specificity …more
Thesis description
19/5/2022 13:06, Mgr. Michal Štefánik, Ph.D., UČO 422237
Consultant
Theses on a related topic
List of theses with an identical keyword.
-
Speeding up inference time of neural machine translation
Mgr. Martin Geletka, UČO 456576 -
Domain-specific English-Czech Neural Machine Translation
Mgr. Martin Wörgötter -
Transformer Neural Networks for Natural Language Processing
Jonáš Konečný -
Pretraining and Evaluation of Czech ALBERT Language Model
RNDr. Petr Zelina, UČO 469366 -
Prediction of missing peaks in mass spectra
Bc. Michal Starý -
Automatic text summarization
Mgr. Adam Hájek -
Utilisation of language representations for Information Retrieval
Ing. Petr Mička -
Optimization techniques of neural networks for mobile platforms during training phase
Ing. Adam Grygar




