BRÁZDIL, Tomáš, Krishnendu CHATTERJEE, Vojtěch FOREJT a Antonín KUČERA. Trading performance for stability in Markov decision processes. Journal of Computer and System Sciences. SAN DIEGO: Elsevier, 2017, roč. 84, č. 2017, s. 144-170. ISSN 0022-0000. Dostupné z: https://dx.doi.org/10.1016/j.jcss.2016.09.009.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Trading performance for stability in Markov decision processes
Autoři BRÁZDIL, Tomáš (203 Česká republika, domácí), Krishnendu CHATTERJEE (40 Rakousko), Vojtěch FOREJT (203 Česká republika, domácí) a Antonín KUČERA (203 Česká republika, garant, domácí).
Vydání Journal of Computer and System Sciences, SAN DIEGO, Elsevier, 2017, 0022-0000.
Další údaje
Originální jazyk angličtina
Typ výsledku Článek v odborném periodiku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Spojené státy
Utajení není předmětem státního či obchodního tajemství
Impakt faktor Impact factor: 1.497
Kód RIV RIV/00216224:14330/17:00094587
Organizační jednotka Fakulta informatiky
Doi http://dx.doi.org/10.1016/j.jcss.2016.09.009
UT WoS 000388430000011
Klíčová slova anglicky Markov decision processes; Mean payoff; Stability; Stochastic systems; Controller synthesis
Štítky formela-journal
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 27. 4. 2018 10:34.
Anotace
We study controller synthesis problems for finite-state Markov decision processes, where the objective is to optimize the expected mean-payoff performance and stability (also known as variability in the literature). We argue that the basic notion of expressing the stability using the statistical variance of the mean payoff is sometimes insufficient, and propose an alternative definition. We show that a strategy ensuring both the expected mean payoff and the variance below given bounds requires randomization and memory, under both the above definitions. We then show that the problem of finding such a strategy can be expressed as a set of constraints.
Návaznosti
GA15-17564S, projekt VaVNázev: Teorie her jako prostředek pro formální analýzu a verifikaci počítačových systémů
Investor: Grantová agentura ČR, Teorie her jako prostředek pro formální analýzu a verifikaci počítačových systémů
VytisknoutZobrazeno: 10. 8. 2024 16:41