D 2020

Multiple-Environment Markov Decision Processes: Efficient Analysis and Applications

CHATTERJEE, Krishnendu; Martin CHMELÍK; Deep KARKHANIS; Petr NOVOTNÝ; Amélie ROYER et. al.

Základní údaje

Originální název

Multiple-Environment Markov Decision Processes: Efficient Analysis and Applications

Autoři

CHATTERJEE, Krishnendu; Martin CHMELÍK; Deep KARKHANIS; Petr NOVOTNÝ a Amélie ROYER

Vydání

Palo Alto, Proceedings of the International Conference on Automated Planning and Scheduling, od s. 48-56, 9 s. 2020

Nakladatel

AAAI Press

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Spojené státy

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Odkazy

Kód RIV

RIV/00216224:14330/20:00114616

Organizační jednotka

Fakulta informatiky

ISBN

978-1-57735-824-4

ISSN

EID Scopus

2-s2.0-85088499875

Klíčová slova anglicky

decision making; Markov decision processes; contextual recommendations

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 29. 4. 2021 08:12, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Multiple-environment Markov decision processes (MEMDPs) are MDPs equipped with not one, but multiple probabilistic transition functions, which represent the various possible unknown environments. While the previous research on MEMDPs focused on theoretical properties for long-run average payoff, we study them with discounted-sum payoff and focus on their practical advantages and applications. MEMDPs can be viewed as a special case of Partially observable and Mixed observability MDPs: the state of the system is perfectly observable, but not the environment. We show that the specific structure of MEMDPs allows for more efficient algorithmic analysis, in particular for faster belief updates. We demonstrate the applicability of MEMDPs in several domains. In particular, we formalize the sequential decision-making approach to contextual recommendation systems as MEMDPs and substantially improve over the previous MDP approach.

Návaznosti

GA19-15134Y, interní kód MU
Název: Verifikace a analýza pravděpodobnostních programů
Investor: Grantová agentura ČR, Verifikace a analýza pravděpodobnostních programů
GJ19-15134Y, projekt VaV
Název: Verifikace a analýza pravděpodobnostních programů