Risk-Sensitive Reinforcement Learning

Kadlčík, Marek

Bakalářská práce

Cena děkana FI za vynikající závěrečnou práci

Risk-Sensitive Reinforcement Learning

Marek Kadlčík, učo 485294

Anotace

Cílem standardních metod zpětnovazebního učení je maximalizovat očekávaný budoucí zisk. Ukazujeme motivaci pro zvážení risku při rozhodování, popisujeme zavedené definice risku a formulujeme odpovídající účelové fukce v kontextu zpětnovazebního učení. Nakonec poskytujememe rozsáhlý přehled existujících metod v literatuře pro jejich optimalizaci a uvádíme možné budoucích směry v této oblasti.

Abstract

Standard reinforcement learning methods aim to maximize the average future returns. We show a motivation for consideration of risk in decision-making, describe established definitions of risk and formulate corresponding risk-constrained and risk-penalizing objectives in context of reinforcement learning. Finally, we provide an extensive overview of existing methods in the literature for their optimization and state possible future directions in the field.

Klíčová slova

reinforcement learning Markov decision process dynamic programming machine learning Monte Carlo Q-Learning REINFORCE Actor-critic expected utility mean-variance conditional value at risk CVaR risk of ruin chance-constraint

Zadání práce

The student's task is to study reinforcement learning in the context of risk-sensitive payoff evaluation. In particular, risk-sensitive evaluation is a domain overlapping with economics where the influence of human understanding of risk is considered, contrary to the basic mathematical approach evaluation average payoff only. The expected work will therefore be an overview of possible approaches in the given area.

Administrativní informace

Práce zkontrolována:
26. 5. 2021 10:53, doc. RNDr. Vojtěch Řehák, Ph.D., učo 3721

Zadáno/změněno 2. 7. 2021 08:29, Helena Kryštofová
Záznam založen 29. 4. 2021 13:21, Jana Zemanová, učo 9619
Zveřejnit od 25. 5. 2021 12:41, Miroslava Tomíčková, učo 114718
Práce převzata 25. 5. 2021 12:41, Miroslava Tomíčková, učo 114718

Plný text práce

898,4 KB / soubor PDF

Přílohy

Jazyk práce

angličtina

Termín obhajoby

1. 7. 2021

Práce byla úspěšně obhájena

Vedoucí

doc. RNDr. Vojtěch Řehák, Ph.D., učo 3721
KTP FI MU

Posudek vedoucího

Oponent

doc. RNDr. Petr Novotný, Ph.D., učo 172743
KTP FI MU

Posudek oponenta

Citovat tuto práci

Citace dle normy ČSN ISO 690

KADLČÍK, Marek. Risk-Sensitive Reinforcement Learning. Online. Bakalářská práce. Brno: Masarykova univerzita, Fakulta informatiky. 2021. Dostupné z: https://is.muni.cz/th/efw88/.

@misc{Kadlcik2021thesis, AUTHOR = {Kadlčík, Marek}, TITLE = {Risk-Sensitive Reinforcement Learning}, YEAR = {2021}, TYPE = {Bakalářská práce}, INSTITUTION = {Masarykova univerzita, Fakulta informatiky}, LOCATION = {Brno}, SUPERVISOR = {Vojtěch Řehák}, URL = {https://is.muni.cz/th/efw88/}, URL_DATE = {2026-07-05}, }

{{Citace kvalifikační práce | příjmení = Kadlčík | jméno = Marek | instituce = Masarykova univerzita, Fakulta informatiky | odkaz na instituci = Fakulta informatiky Masarykovy univerzity | titul = Risk-Sensitive Reinforcement Learning | url = https://is.muni.cz/th/efw88/ | typ práce = Bakalářská práce | vedoucí = Vojtěch Řehák | odkaz na vedoucího = {{UČO na článek|3721}} | místo = Brno | rok = 2021 | počet stran = | strany = | citace = 2026-07-05 | poznámka = | jazyk = en }}

Masarykova univerzita Fakulta informatiky

Studijní program

Informatika

Obor

Umělá inteligence a zpracování přirozeného jazyka

Práce na příbuzné téma

Seznam prací, které mají shodná klíčová slova.

Multidimenzionální posilované učení

Bc. Oliver Roch, učo 445413
Deep Risk-Constrained Reinforcement Learning with Safety Critics

Mgr. Martin Gendiar
Využití strojového učení pro tvorbu optimálních útočných strategií

Mgr. Michal Savčinský
Revisiting Uncertainty Quantification for Offline Reinforcement Learning

Mgr. Vít Unčovský
Pareto Frontier Estimation in Offline Safe Reinforcement Learning

Mgr. Václav Nevyhoštěný
Risk-Aversion in Algorithms for Poker

Mgr. Martin Horáček
Experimental Evaluation of Risk-Averse Planners

Bc. Martin Bendel
Reinforcement Learning for Efficient Attack Agents Training

Ing. Glenn Fischer

Podobné práce

Název

Vložil

Vloženo

Práva

Archiv závěrečné práce Marek Kadlčík FI B-IN UMI, učo 485294 efw88/6

Zemanová, J.

29. 4. 2021

Složky

Soubory

Anotace anglicky annotation_english.txt

Kadlčík, M.

24. 5. 2021

Anotace česky annotation.txt

Kadlčík, M.

24. 5. 2021

Klíčová slova keywords.txt

Kadlčík, M.

24. 5. 2021

Plný text práce bachelor-thesis.pdf

Kadlčík, M.

24. 5. 2021

Posudek oponenta posudek_oponenta_Novotny.pdf

Novotný, P.

21. 6. 2021

Posudek vedoucího posudek_vedouciho_Rehak.pdf

Řehák, V.

18. 6. 2021

Přidání souboru

Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
Další operace se soubory

Podrobnosti lze zjistit označením příslušného řádku.
Pohled pro experty

Pro častou práci je možné zvolit režim Více možností.
Vyhledávání souborů

Vyhledávaný výraz můžete zadat přímo do adresního řádku.
Rychlý přístup k souborům

Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.

Závěrečná práce: Marek Kadlčík, učo 485294: Risk-Sensitive Reinforcement Learning

Bakalářská práce

Risk-Sensitive Reinforcement Learning

Anotace

Abstract

Klíčová slova

Zadání práce

Přílohy

Vedoucí

Oponent

Citace dle normy ČSN ISO 690

Práce na příbuzné téma

Složky

Soubory

Přidání souboru

Další operace se soubory

Pohled pro experty

Vyhledávání souborů

Rychlý přístup k souborům