Bakalářská práce
Získaná ocenění: Cena děkana FI za vynikající závěrečnou práci

Risk-Sensitive Reinforcement Learning

Marek Kadlčík, učo 485294
Anotace

Cílem standardních metod zpětnovazebního učení je maximalizovat očekávaný budoucí zisk. Ukazujeme motivaci pro zvážení risku při rozhodování, popisujeme zavedené definice risku a formulujeme odpovídající účelové fukce v kontextu zpětnovazebního učení. Nakonec poskytujememe rozsáhlý přehled existujících metod v literatuře pro jejich optimalizaci a uvádíme možné budoucích směry v této oblasti.

Abstract

Standard reinforcement learning methods aim to maximize the average future returns. We show a motivation for consideration of risk in decision-making, describe established definitions of risk and formulate corresponding risk-constrained and risk-penalizing objectives in context of reinforcement learning. Finally, we provide an extensive overview of existing methods in the literature for their optimization and state possible future directions in the field.

Zadání práce
The student's task is to study reinforcement learning in the context of risk-sensitive payoff evaluation. In particular, risk-sensitive evaluation is a domain overlapping with economics where the influence of human understanding of risk is considered, contrary to the basic mathematical approach evaluation average payoff only. The expected work will therefore be an overview of possible approaches in the given area.
Práce zkontrolována:
26. 5. 2021 10:53, doc. RNDr. Vojtěch Řehák, Ph.D., učo 3721
Plný text práce
898,4 KB / soubor PDF
Jazyk práce
angličtina angličtina
Termín obhajoby
1. 7. 2021
Práce byla úspěšně obhájena

Vedoucí

doc. RNDr. Vojtěch Řehák, Ph.D., učo 3721
KTP FI MU

Oponent

doc. RNDr. Petr Novotný, Ph.D., učo 172743
KTP FI MU

  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.