共找到 1 项 “(美)德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas) 著” 相关结果
策略前展、策略迭代与分布式强化学习
作者: (美)德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas) 著
出版社:清华大学出版社 2022-04-01
简介:本书目的是从作者近出版的《强化学习预控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散/组合优化问题(例如路由,调度,分配和混合整数编程)中的应用,包括在这些情况下使用神经网络近似。本书可作为计算机科学与技术、控制科学与技术、电子科学与技术等相关领域研究生和高年级本科生的教学参考书,也可供信息、通信、控制、优化等领域的科研人员参考。
清华大学出版社 2022-04-01