BRÁZDIL, Tomáš, Petr NOVOTNÝ, Krishnendu CHATTERJEE, Martin CHMELÍK a Anchit GUPTA. Stochastic Shortest Path with Energy Constraints in POMDPs: (Extended Abstract). In Proceedings of the 2016 International Conference on Autonomous Agents & Multiagent Systems. Singapur: ACM, 2016, s. 1465-1466. ISBN 978-1-4503-4239-1.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Stochastic Shortest Path with Energy Constraints in POMDPs: (Extended Abstract)
Autoři BRÁZDIL, Tomáš (203 Česká republika, garant, domácí), Petr NOVOTNÝ (203 Česká republika), Krishnendu CHATTERJEE (356 Indie), Martin CHMELÍK (203 Česká republika) a Anchit GUPTA (356 Indie).
Vydání Singapur, Proceedings of the 2016 International Conference on Autonomous Agents & Multiagent Systems, od s. 1465-1466, 2 s. 2016.
Nakladatel ACM
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
Kód RIV RIV/00216224:14330/16:00088501
Organizační jednotka Fakulta informatiky
ISBN 978-1-4503-4239-1
UT WoS 000465199800247
Klíčová slova anglicky POMDP; planning; energy constraints; decision trees
Štítky formela-conference
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 13. 5. 2020 19:34.
Anotace
We extend the traditional framework of POMDPs to model resource consumption inducing a hard constraint on the behaviour of the model. Resource levels increase and decrease with transitions, and the hard constraint requires that the level remains positive in all steps. We present an algorithm for solving POMDPs with resource levels, developing on existing POMDP solvers. Our second contribution is related to policy representation. For larger POMDPs the policies computed by existing solvers are too large to be understandable, an issue particularly pronounced in POMDPs with resource levels. We present a procedure based on machine learning techniques that extracts important decisions of a policy and outputs its readable representation.
Návaznosti
GBP202/12/G061, projekt VaVNázev: Centrum excelence - Institut teoretické informatiky (CE-ITI) (Akronym: CE-ITI)
Investor: Grantová agentura ČR, Centrum excelence - Institut teoretické informatiky
VytisknoutZobrazeno: 16. 6. 2024 21:54