机读格式显示(MARC)
- 010 __ |a 978-7-302-54032-8 |d CNY149.00
- 100 __ |a 20200522e20202019em y0chiy50 ba
- 200 1_ |a Reinforcement learning and optimal control |f Dimitri P. Bertsekas |d = 强化学习与最优控制 |f (美) 德梅萃·P. 博塞卡斯著 |z chi
- 210 __ |a 北京 |c 清华大学出版社 |d 2020.6
- 215 __ |a xvi, 373页 |c 图 |d 24cm
- 225 2_ |a 国际知名大学原版教材 |A guo ji zhi ming da xue yuan ban jiao cai |i 信息技术学科与电气工程学科系列
- 314 __ |a 德梅萃·P. 博塞卡斯, 美国麻省理工学院教授, 美国工程院院士。
- 320 __ |a 有书目 (第345-368页) 和索引
- 330 __ |a 本书的目的是考虑大型且具有挑战性的多阶段决策问题, 这些问题原则上可以通过动态规划和最优控制来解决, 但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法, 以产生具有足够性能的次优策略。这些方法统称为增强学习, 也可以叫做近似动态规划和神经动态规划等。本书的主题产生于最优控制和人工智能思想的相互作用。本书的目的之一是探索这两个领域之间的共同边界, 并架设一座具有任一领域背景的专业人士都可以访问的桥梁。
- 333 __ |a 可用作人工智能或系统与控制科学等相关专业的高年级本科生或研究生的教材, 也适合开展相关研究工作的专业技术人员作为参考用书
- 410 _0 |1 2001 |a 国际知名大学原版教材 |i 信息技术学科与电气工程学科系列
- 510 1_ |a 强化学习与最优控制 |z chi
- 606 0_ |a 最佳控制 |A zui jia kong zhi |x 高等学校 |j 教材 |x 英文
- 701 _1 |a 博塞卡斯 |A bo sai ka si |g (Bertsekas, Dimitri P.) |4 著
- 801 _0 |a CN |b 湖北三新 |c 20200522