BRÁZDIL, Tomáš, Krishnendu CHATTERJEE, Vojtěch FOREJT a Antonín KUČERA. Trading Performance for Stability in Markov Decision Processes. In Proceedings of 28th Annual ACM/IEEE Symposium on Logic in Computer Science (LICS 2013). London: IEEE Computer Society. s. 331-340. ISBN 978-1-4799-0413-6. doi:10.1109/LICS.2013.39. 2013.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Trading Performance for Stability in Markov Decision Processes
Autoři BRÁZDIL, Tomáš (203 Česká republika, domácí), Krishnendu CHATTERJEE (356 Indie), Vojtěch FOREJT (203 Česká republika, domácí) a Antonín KUČERA (203 Česká republika, garant, domácí).
Vydání London, Proceedings of 28th Annual ACM/IEEE Symposium on Logic in Computer Science (LICS 2013), od s. 331-340, 10 s. 2013.
Nakladatel IEEE Computer Society
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Spojené státy
Utajení není předmětem státního či obchodního tajemství
Forma vydání paměťový nosič (CD, DVD, flash disk)
Kód RIV RIV/00216224:14330/13:00066541
Organizační jednotka Fakulta informatiky
ISBN 978-1-4799-0413-6
ISSN 1043-6871
Doi http://dx.doi.org/10.1109/LICS.2013.39
UT WoS 000326815000038
Klíčová slova česky Markovovy rozhodovací procesy; optimalizace
Klíčová slova anglicky Markov decision processes; optimization
Štítky core_A, firank_1, formela-conference
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 24. 4. 2014 18:43.
Anotace
We study the complexity of central controller synthesis problems for finite-state Markov decision processes, where the objective is to optimize both the expected mean-payoff performance of the system and its stability. We argue that the basic theoretical notion of expressing the stability in terms of the variance of the mean-payoff (called global variance in our paper) is not always sufficient, since it ignores possible instabilities on respective runs. For this reason we propose alernative definitions of stability, which we call local and hybrid variance, and which express how rewards on each run deviate from the run's own mean-payoff and from the expected mean-payoff, respectively.
Návaznosti
GPP202/12/P612, projekt VaVNázev: Formální verifikace stochastických systémů s reálným časem (Akronym: Formální verifikace stochastických systémů s reáln)
Investor: Grantová agentura ČR, Formální verifikace stochastických systémů s reálným časem
VytisknoutZobrazeno: 29. 3. 2024 08:41