Závěrečná práce: Richard Schwarz, učo 521781: Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms
Bakalářská práce
Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms
Anotace
Táto práca skúma integráciu Monte Carlo stromového vyhľadávania (MCTS) do algoritmov hlbokého posilňovacieho učenia. Po prvé, predstavujeme MCTS ako samostatnú politiku pre Markovské rozhodovacie procesy (MDP). Po druhé, kombinujeme ho s prístupmi založenými na modelovom posilňovacom učení, pričom využívame MCTS ako plánovací nástroj. Začíname s AlphaZero, ktorý operuje pod silnými predpokladmi o znalostiach …více
Abstract
This thesis explores the integration of Monte Carlo tree search (MCTS) into deep reinforcement learning algorithms. Firstly, we introduce MCTS as a standalone policy for Markov decision processes (MDP). Secondly, we combine it with model-based reinforcement learning approaches by utilizing MCTS as a planning tool. We start with AlphaZero, which operates under strong assumptions about the knowledge …více
Zadání práce
- Description and explanation of the Monte Carlo tree search framework
- Description and an explanation of the key MCTS-based reinforcement learning algorithms, namely AlphaZero, MuZero, and stochastic MuZero. This will include not only the explanation of the core MCTS-based components, but also a discussion of the neural net components, their architecture, and training.
- A lightweight experimental part which will report on an application of an existing implementation of (stochastic) MuZero on some standard benchmark of the author's choice. The goal is to report on possible pitfalls of applying the studied algorithms in practice.
24. 5. 2024 19:15, doc. RNDr. Petr Novotný, Ph.D., učo 172743
Práce na příbuzné téma
Seznam prací, které mají shodná klíčová slova.
-
Hluboké posilované učení s modelem prostředí a spojitými akcemi
Mgr. Karol Kuna -
Reinforcement Learning for the Game of Battleship
Mgr. Tomáš Kancko -
Artificial Intelligence in the Elementals Game
Mgr. Jozef Vilkolák -
Třídění odpadu pomocí neuronových sítí
Bc. Jozef Marko, učo 422433 -
Metody vysvětlitelnosti chování neuronových sítí
Mgr. Vojtěch Krajňanský -
Zraková dráha jako neuronová síť
Mgr. Veronika Koňaříková -
Tool for data pre-processing and iterative learning of neural networks
Ing. Kristián Malák -
Intelligence artificielle dans l'expérimentation de la reconnaissance vocale des rappeurs français : enjeux de la mise en relief des oppositions phonologiques
Mgr. Zuzana Pénzešová




