机读格式显示(MARC)

000 01143nam0 2200253 450

001 0000374677

005 20251212204000.0

010 __ |a 978-7-302-68241-7 |d CNY69.00

049 __ |a O350102XHF |b UCS01013207267 |c 013207267

100 __ |a 20250526d2025 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 强化学习 |9 qiang hua xue xi |b 专著 |e 从原理到实践 |f 李福林著

210 __ |a 北京 |c 清华大学出版社 |d 2025

215 __ |a 12,237页 |c 图 |d 24cm

300 __ |a 跟我一起学人工智能

330 __ |a 本书分6篇共18章，基础篇(第1章和第2章)介绍了强化学习中的基本概念。基础算法篇(第3~6章)介绍了QLearning算法、SARSA算法、DQN算法、Reinforce算法。高级算法篇(第7~12章)介绍了AC算法、A2C算法、PPO算法、DDPG算法、TD3算法、SAC算法、模仿学习算法。多智能体篇(第13章和第14章)介绍了在一个系统中存在多智能体时，各个智能体之间的合作、对抗等关系，以及各个智能体之间的通信策略。扩展算法篇(第15~17章)介绍了CQL算法、MPC算法、HER算法。框架篇(第18章)介绍了强化学习框架SB3的使用方法。

606 0_ |a 机器学习

690 __ |a TP181 |v 5

701 _0 |a 李福林 |9 li fu lin |4 著

801 _0 |a CN |b GDPTC |c 20251212

905 __ |a GDPTC |d TP181/375