Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms

Schwarz, Richard

Bakalářská práce

Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms

Richard Schwarz, učo 521781

Anotace

Táto práca skúma integráciu Monte Carlo stromového vyhľadávania (MCTS) do algoritmov hlbokého posilňovacieho učenia. Po prvé, predstavujeme MCTS ako samostatnú politiku pre Markovské rozhodovacie procesy (MDP). Po druhé, kombinujeme ho s prístupmi založenými na modelovom posilňovacom učení, pričom využívame MCTS ako plánovací nástroj. Začíname s AlphaZero, ktorý operuje pod silnými predpokladmi o znalostiach …víceméně

Abstract

This thesis explores the integration of Monte Carlo tree search (MCTS) into deep reinforcement learning algorithms. Firstly, we introduce MCTS as a standalone policy for Markov decision processes (MDP). Secondly, we combine it with model-based reinforcement learning approaches by utilizing MCTS as a planning tool. We start with AlphaZero, which operates under strong assumptions about the knowledge …víceméně

Klíčová slova

Monte Carlo tree search deep reinforcement learning model-based reinforcement learning UCB AlphaZero MuZero Stochastic MuZero neural network

Zadání práce

The goal of the thesis is the survey of of deep reinforcement learning algorithms based on the Monte Carlo tree search (MCTS) framework. The ultimate focus is on a clear, readable, and thorough explanation of the Stochastic MuZero algorithm. The goal is for a reader knowledgeable in general reinforcement learning (and its implementation aspects) to be able to design a crude implementation of the aforementioned algorithms based on the information acquired from the thesis. Hence, the expected outputs of the thesis are as follows:

Description and explanation of the Monte Carlo tree search framework
Description and an explanation of the key MCTS-based reinforcement learning algorithms, namely AlphaZero, MuZero, and stochastic MuZero. This will include not only the explanation of the core MCTS-based components, but also a discussion of the neural net components, their architecture, and training.
A lightweight experimental part which will report on an application of an existing implementation of (stochastic) MuZero on some standard benchmark of the author's choice. The goal is to report on possible pitfalls of applying the studied algorithms in practice.

Administrativní informace

Práce zkontrolována:
24. 5. 2024 19:15, doc. RNDr. Petr Novotný, Ph.D., učo 172743

Zadáno/změněno 25. 6. 2024 08:48, Miroslava Tomíčková, učo 114718
Záznam založen 25. 4. 2024 09:48, Mgr. Lenka Kubová, učo 247849
Zveřejnit od 23. 5. 2024 10:30, Alena Dvořáková
Práce převzata 23. 5. 2024 10:30, Alena Dvořáková

Plný text práce

1,6 MB / soubor PDF

Přílohy

Jazyk práce

angličtina

Termín obhajoby

24. 6. 2024

Práce byla úspěšně obhájena

Vedoucí

doc. RNDr. Petr Novotný, Ph.D., učo 172743
KTP FI MU

Posudek vedoucího

Oponent

Mgr. Martin Kurečka
KTP FI MU

Posudek oponenta

Citovat tuto práci

Citace dle normy ČSN ISO 690

SCHWARZ, Richard. Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms. Online. Bakalářská práce. Brno: Masarykova univerzita, Fakulta informatiky. 2024. Dostupné z: https://is.muni.cz/th/k37az/.

@misc{Schwarz2024thesis, AUTHOR = {Schwarz, Richard}, TITLE = {Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms}, YEAR = {2024}, TYPE = {Bakalářská práce}, INSTITUTION = {Masarykova univerzita, Fakulta informatiky}, LOCATION = {Brno}, SUPERVISOR = {Petr Novotný}, URL = {https://is.muni.cz/th/k37az/}, URL_DATE = {2026-06-26}, }

{{Citace kvalifikační práce | příjmení = Schwarz | jméno = Richard | instituce = Masarykova univerzita, Fakulta informatiky | odkaz na instituci = Fakulta informatiky Masarykovy univerzity | titul = Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms | url = https://is.muni.cz/th/k37az/ | typ práce = Bakalářská práce | vedoucí = Petr Novotný | odkaz na vedoucího = {{UČO na článek|172743}} | místo = Brno | rok = 2024 | počet stran = | strany = | citace = 2026-06-26 | poznámka = | jazyk = en }}

Masarykova univerzita Fakulta informatiky

Studijní program

Informatika

Plán

Informatika

Práce na příbuzné téma

Seznam prací, které mají shodná klíčová slova.

Hluboké posilované učení s modelem prostředí a spojitými akcemi

Mgr. Karol Kuna
Reinforcement Learning for the Game of Battleship

Mgr. Tomáš Kancko
Artificial Intelligence in the Elementals Game

Mgr. Jozef Vilkolák
Třídění odpadu pomocí neuronových sítí

Bc. Jozef Marko, učo 422433
Metody vysvětlitelnosti chování neuronových sítí

Mgr. Vojtěch Krajňanský
Zraková dráha jako neuronová síť

Mgr. Veronika Koňaříková
Tool for data pre-processing and iterative learning of neural networks

Ing. Kristián Malák
Intelligence artificielle dans l'expérimentation de la reconnaissance vocale des rappeurs français : enjeux de la mise en relief des oppositions phonologiques

Mgr. Zuzana Pénzešová

Podobné práce

Název

Vložil

Vloženo

Práva

Archiv závěrečné práce Richard Schwarz FI B-INF IN, učo 521781 k37az/7

Kubová, L.

25. 4. 2024

Složky

Soubory

Anotace anglicky annotation_english.txt

Schwarz, R.

22. 5. 2024

Anotace česky annotation.txt

Schwarz, R.

22. 5. 2024

Klíčová slova keywords.txt

Schwarz, R.

22. 5. 2024

Plný text práce thesis.pdf

Schwarz, R.

22. 5. 2024

Posudek oponenta posudek_oponenta_Kurecka.pdf

Kurečka, M.

13. 6. 2024

Posudek vedoucího posudek_vedouciho_Novotny.pdf

Novotný, P.

14. 6. 2024

Přidání souboru

Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
Další operace se soubory

Podrobnosti lze zjistit označením příslušného řádku.
Pohled pro experty

Pro častou práci je možné zvolit režim Více možností.
Vyhledávání souborů

Vyhledávaný výraz můžete zadat přímo do adresního řádku.
Rychlý přístup k souborům

Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.

Závěrečná práce: Richard Schwarz, učo 521781: Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms

Bakalářská práce

Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms

Anotace

Abstract

Klíčová slova

Zadání práce

Přílohy

Vedoucí

Oponent

Citace dle normy ČSN ISO 690

Práce na příbuzné téma

Složky

Soubory

Přidání souboru

Další operace se soubory

Pohled pro experty

Vyhledávání souborů

Rychlý přístup k souborům