机读格式显示(MARC)
- 000 01143nam0 2200253 450
- 010 __ |a 978-7-302-68241-7 |d CNY69.00
- 049 __ |a O350102XHF |b UCS01013207267 |c 013207267
- 100 __ |a 20250526d2025 em y0chiy50 ea
- 200 1_ |a 强化学习 |9 qiang hua xue xi |b 专著 |e 从原理到实践 |f 李福林著
- 210 __ |a 北京 |c 清华大学出版社 |d 2025
- 215 __ |a 12,237页 |c 图 |d 24cm
- 330 __ |a 本书分6篇共18章,基础篇(第1章和第2章)介绍了强化学习中的基本概念。基础算法篇(第3~6章)介绍了QLearning算法、SARSA算法、DQN算法、Reinforce算法。高级算法篇(第7~12章)介绍了AC算法、A2C算法、PPO算法、DDPG算法、TD3算法、SAC算法、模仿学习算法。多智能体篇(第13章和第14章)介绍了在一个系统中存在多智能体时,各个智能体之间的合作、对抗等关系,以及各个智能体之间的通信策略。扩展算法篇(第15~17章)介绍了CQL算法、MPC算法、HER算法。框架篇(第18章)介绍了强化学习框架SB3的使用方法。
- 701 _0 |a 李福林 |9 li fu lin |4 著
- 801 _0 |a CN |b GDPTC |c 20251212
- 905 __ |a GDPTC |d TP181/375