2020
Multiple-Environment Markov Decision Processes: Efficient Analysis and Applications
CHATTERJEE, Krishnendu; Martin CHMELÍK; Deep KARKHANIS; Petr NOVOTNÝ; Amélie ROYER et. al.Základní údaje
Originální název
Multiple-Environment Markov Decision Processes: Efficient Analysis and Applications
Autoři
CHATTERJEE, Krishnendu; Martin CHMELÍK; Deep KARKHANIS; Petr NOVOTNÝ a Amélie ROYER
Vydání
Palo Alto, Proceedings of the International Conference on Automated Planning and Scheduling, od s. 48-56, 9 s. 2020
Nakladatel
AAAI Press
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10200 1.2 Computer and information sciences
Stát vydavatele
Spojené státy
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
elektronická verze "online"
Odkazy
Kód RIV
RIV/00216224:14330/20:00114616
Organizační jednotka
Fakulta informatiky
ISBN
978-1-57735-824-4
ISSN
EID Scopus
2-s2.0-85088499875
Klíčová slova anglicky
decision making; Markov decision processes; contextual recommendations
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 29. 4. 2021 08:12, RNDr. Pavel Šmerk, Ph.D.
Anotace
V originále
Multiple-environment Markov decision processes (MEMDPs) are MDPs equipped with not one, but multiple probabilistic transition functions, which represent the various possible unknown environments. While the previous research on MEMDPs focused on theoretical properties for long-run average payoff, we study them with discounted-sum payoff and focus on their practical advantages and applications. MEMDPs can be viewed as a special case of Partially observable and Mixed observability MDPs: the state of the system is perfectly observable, but not the environment. We show that the specific structure of MEMDPs allows for more efficient algorithmic analysis, in particular for faster belief updates. We demonstrate the applicability of MEMDPs in several domains. In particular, we formalize the sequential decision-making approach to contextual recommendation systems as MEMDPs and substantially improve over the previous MDP approach.
Návaznosti
| GA19-15134Y, interní kód MU |
| ||
| GJ19-15134Y, projekt VaV |
|