2017
Trading performance for stability in Markov decision processes
BRÁZDIL, Tomáš, Krishnendu CHATTERJEE, Vojtěch FOREJT a Antonín KUČERAZákladní údaje
Originální název
Trading performance for stability in Markov decision processes
Autoři
BRÁZDIL, Tomáš (203 Česká republika, domácí), Krishnendu CHATTERJEE (40 Rakousko), Vojtěch FOREJT (203 Česká republika, domácí) a Antonín KUČERA (203 Česká republika, garant, domácí)
Vydání
Journal of Computer and System Sciences, SAN DIEGO, Elsevier, 2017, 0022-0000
Další údaje
Jazyk
angličtina
Typ výsledku
Článek v odborném periodiku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Spojené státy
Utajení
není předmětem státního či obchodního tajemství
Impakt faktor
Impact factor: 1.497
Kód RIV
RIV/00216224:14330/17:00094587
Organizační jednotka
Fakulta informatiky
UT WoS
000388430000011
Klíčová slova anglicky
Markov decision processes; Mean payoff; Stability; Stochastic systems; Controller synthesis
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 27. 4. 2018 10:34, RNDr. Pavel Šmerk, Ph.D.
Anotace
V originále
We study controller synthesis problems for finite-state Markov decision processes, where the objective is to optimize the expected mean-payoff performance and stability (also known as variability in the literature). We argue that the basic notion of expressing the stability using the statistical variance of the mean payoff is sometimes insufficient, and propose an alternative definition. We show that a strategy ensuring both the expected mean payoff and the variance below given bounds requires randomization and memory, under both the above definitions. We then show that the problem of finding such a strategy can be expressed as a set of constraints.
Návaznosti
GA15-17564S, projekt VaV |
|