CHATTERJEE, Krishnendu, Martin CHMELÍK, Deep KARKHANIS, Petr NOVOTNÝ a Amélie ROYER. Multiple-Environment Markov Decision Processes: Efficient Analysis and Applications. Online. In Proceedings of the International Conference on Automated Planning and Scheduling. Palo Alto: AAAI Press, 2020, s. 48-56. ISBN 978-1-57735-824-4.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Multiple-Environment Markov Decision Processes: Efficient Analysis and Applications
Autoři CHATTERJEE, Krishnendu (356 Indie), Martin CHMELÍK (203 Česká republika), Deep KARKHANIS (356 Indie), Petr NOVOTNÝ (203 Česká republika, garant, domácí) a Amélie ROYER (250 Francie).
Vydání Palo Alto, Proceedings of the International Conference on Automated Planning and Scheduling, od s. 48-56, 9 s. 2020.
Nakladatel AAAI Press
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10200 1.2 Computer and information sciences
Stát vydavatele Spojené státy
Utajení není předmětem státního či obchodního tajemství
Forma vydání elektronická verze "online"
WWW URL
Kód RIV RIV/00216224:14330/20:00114616
Organizační jednotka Fakulta informatiky
ISBN 978-1-57735-824-4
ISSN 2334-0835
Klíčová slova anglicky decision making; Markov decision processes; contextual recommendations
Štítky core_A, firank_1, formela-dec
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 29. 4. 2021 08:12.
Anotace
Multiple-environment Markov decision processes (MEMDPs) are MDPs equipped with not one, but multiple probabilistic transition functions, which represent the various possible unknown environments. While the previous research on MEMDPs focused on theoretical properties for long-run average payoff, we study them with discounted-sum payoff and focus on their practical advantages and applications. MEMDPs can be viewed as a special case of Partially observable and Mixed observability MDPs: the state of the system is perfectly observable, but not the environment. We show that the specific structure of MEMDPs allows for more efficient algorithmic analysis, in particular for faster belief updates. We demonstrate the applicability of MEMDPs in several domains. In particular, we formalize the sequential decision-making approach to contextual recommendation systems as MEMDPs and substantially improve over the previous MDP approach.
Návaznosti
GA19-15134Y, interní kód MUNázev: Verifikace a analýza pravděpodobnostních programů
Investor: Grantová agentura ČR, Verifikace a analýza pravděpodobnostních programů
GJ19-15134Y, projekt VaVNázev: Verifikace a analýza pravděpodobnostních programů
VytisknoutZobrazeno: 26. 4. 2024 14:38