Improving Arithmetical Reasoning of Language Models

Kadlčík, Marek

Diplomová práce

Cena děkana FI za vynikající závěrečnou práci

Improving Arithmetical Reasoning of Language Models

Bc. Marek Kadlčík, učo 485294

Anotace

Práce se zabývá zlepšováním jazykových modelů pro řešení matematických slovních úloh. Nejdříve pročištíme a převedeme existující datové sady, abychom vytvořili Calc-X, standardizovanou sbírku 300 000 matematických příkladu a řešení s postupem. Demonstrujeme, že Calc-X je vhodný pro tréning jazykových modelů, které interagují s kalkulačkou pro počítání mezivýsledků při řešení matematických úloh. Ukazujeme …víceméně

Abstract

This work focuses on improving language models for solving math word problems. First, we clean and transform existing datasets to create Calc-X, a standardized collection of 300,000 math problems with step-by-step solutions. We demonstrate that Calc-X is suitable for training language models interacting with a calculator to compute intermediate results when solving math problems. We show that such …víceméně

Klíčová slova

language models neural networks dataset arithmetical reasoning math word problems tool-using self-training supervised learning preference optimization

Zadání práce

While language models excel in many tasks, they often fail to solve even trivial math problems. This work aims to enhance the arithmetical reasoning abilities of language models. This thesis will address the problem in three parts:

1. Dataset curation
The work will review existing datasets for arithmetical reasoning, organize them into a consistent format with explicit annotations of calculations and remove data leaks between train and test split with an n-gram lexical overlap method.

2. Training calculator-using models
The work will implement an inference method for language models that enables interaction with a calculator within generation, train calculator-using models of two sizes with supervised learning on the created dataset, and compare their accuracy to the traditional generation.

3. Self-training
Additionally, the work will develop a prototype of offline and online self-training to explore their potential for autonomously improving model accuracy. The offline experiment includes generating predictions on a subset of the training dataset using a trained model and applying selected preference-optimization methods to align the model toward generating solutions with a correct result. In the online setup, predictions will be generated dynamically during self-training.
Both experiments will compare the accuracy of preference-optimization methods to a self-training baseline with a supervised next-token cross-entropy loss.

Administrativní informace

Práce zkontrolována:
27. 5. 2024 10:43, Mgr. Michal Štefánik, Ph.D., učo 422237

Zadáno/změněno 24. 6. 2024 08:47, Miroslava Tomíčková, učo 114718
Záznam založen 25. 4. 2024 09:55, Mgr. Lenka Kubová, učo 247849
Zveřejnit od 21. 5. 2024 10:15, Miroslava Tomíčková, učo 114718
Práce převzata 21. 5. 2024 10:15, Miroslava Tomíčková, učo 114718

Plný text práce

876,6 KB / soubor PDF

Přílohy (1)

Přílohy

implementation.zip

Příloha

Jazyk práce

angličtina

Termín obhajoby

21. 6. 2024

Práce byla úspěšně obhájena

Vedoucí

Mgr. Michal Štefánik, Ph.D., učo 422237
KVI FI MU

Posudek vedoucího

Oponent

Ing. Martin Fajčík, Ph.D.
KVI FI MU

Posudek oponenta

Citovat tuto práci

Citace dle normy ČSN ISO 690

KADLČÍK, Marek. Improving Arithmetical Reasoning of Language Models. Online. Diplomová práce. Brno: Masarykova univerzita, Fakulta informatiky. 2024. Dostupné z: https://is.muni.cz/th/vd9wm/.

@MastersThesis{Kadlcik2024thesis, AUTHOR = {Kadlčík, Marek}, TITLE = {Improving Arithmetical Reasoning of Language Models}, YEAR = {2024}, TYPE = {Diplomová práce}, INSTITUTION = {Masarykova univerzita, Fakulta informatiky}, LOCATION = {Brno}, SUPERVISOR = {Michal Štefánik}, URL = {https://is.muni.cz/th/vd9wm/}, URL_DATE = {2026-07-02}, }

{{Citace kvalifikační práce | příjmení = Kadlčík | jméno = Marek | instituce = Masarykova univerzita, Fakulta informatiky | odkaz na instituci = Fakulta informatiky Masarykovy univerzity | titul = Improving Arithmetical Reasoning of Language Models | url = https://is.muni.cz/th/vd9wm/ | typ práce = Diplomová práce | vedoucí = Michal Štefánik | odkaz na vedoucího = {{UČO na článek|422237}} | místo = Brno | rok = 2024 | počet stran = | strany = | citace = 2026-07-02 | poznámka = | jazyk = en }}

Masarykova univerzita Fakulta informatiky

Studijní program

Umělá inteligence a zpracování dat

Plán

Strojové učení a umělá inteligence

Práce na příbuzné téma

Seznam prací, které mají shodná klíčová slova.

Měření pobouření na českém Twitteru

Bc. Petr Rusnok
Měření pobouření na českém Twitteru

Bc. Petr Rusnok
Axes of Robustness of Neural Language Models

Mgr. Michal Štefánik, Ph.D., učo 422237
Data analysis for nuclear magnetic resonance spectroscopy

RNDr. David Porteš
Anomaly Detection Using Deep Sparse Autoencoders for CERN Particle Detector Data

Bc. Filip Široký, učo 445415
Neuronové sítě a jejich aplikace

Mgr. Erik Benovič, učo 502902
Detekce objektů v průmyslových datových množinách

Mgr. Hai Duong Tran
Automatization of grouting robots hardware optimization

Mgr. Ronald Luc, učo 235313

Podobné práce

Název

Vložil

Vloženo

Práva

Archiv závěrečné práce Marek Kadlčík FI N-UIZD SUUI, učo 485294 vd9wm/8

Kubová, L.

25. 4. 2024

Složky

Soubory

Anotace anglicky annotation_english.txt

Kadlčík, M.

20. 5. 2024

Anotace česky annotation.txt

Kadlčík, M.

20. 5. 2024

Klíčová slova keywords.txt

Kadlčík, M.

20. 5. 2024

Plný text práce Improving_Arithmetical_Reasoning_of_Language_Models-3.pdf

Kadlčík, M.

21. 5. 2024

Posudek oponenta posudek_oponenta_Fajcik.pdf

Fajčík, M.

5. 6. 2024

Posudek vedoucího posudek_vedouciho_Stefanik.pdf

Štefánik, M.

4. 6. 2024

Příloha implementation.zip

Kadlčík, M.

20. 5. 2024

Přidání souboru

Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
Další operace se soubory

Podrobnosti lze zjistit označením příslušného řádku.
Pohled pro experty

Pro častou práci je možné zvolit režim Více možností.
Vyhledávání souborů

Vyhledávaný výraz můžete zadat přímo do adresního řádku.
Rychlý přístup k souborům

Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.

Závěrečná práce: Bc. Marek Kadlčík, učo 485294: Improving Arithmetical Reasoning of Language Models

Diplomová práce

Improving Arithmetical Reasoning of Language Models

Anotace

Abstract

Klíčová slova

Zadání práce

Přílohy

implementation.zip

Vedoucí

Oponent

Citace dle normy ČSN ISO 690

Práce na příbuzné téma

Složky

Soubory

Přidání souboru

Další operace se soubory

Pohled pro experty

Vyhledávání souborů

Rychlý přístup k souborům