机读格式显示(MARC)
- 010 __ |a 978-7-302-58794-1 |d CNY69.00
- 100 __ |a 20211020d2021 em y0chiy50 ea
- 200 1_ |a 强化学习 |A qiang hua xue xi |e 微课版 |f 袁莎, 白朔天, 唐杰著
- 210 __ |a 北京 |c 清华大学出版社 |d 2021.10
- 215 __ |a 20, 276页, [4] 页图版 |c 图 (部分彩图) |d 26cm
- 225 2_ |a 面向新工科专业建设计算机系列教材 |A mian xiang xin gong ke zhuan ye jian she ji suan ji xi lie jiao cai |i 人工智能
- 314 __ |a 袁莎, 北京智能源人工智能研究院数据总监, 副研究员。白朔天, 博士, 国内一线互联网公司资深算法专家、人工智能顾问。唐杰, 清华大学计算机系教授、系副主任。
- 320 __ |a 有书目 (第268-274页)
- 330 __ |a 本书为读者构建了一个完整的强化学习入门路径, 深入浅出地介绍了强化学习算法的基本原理和实现方法。在正文开始前, 本书带着初学者回顾了相关预备知识, 包括数学基础和机器学习基础。在正文部分, 本书首先介绍了强化学习的基本概念, 给出了强化学习的数学框架 (马尔科夫决策过程), 随后介绍了强化学习的求解算法, 包括表格求解法 (动态规划法、蒙特卡洛法和时序差分法) , 以及近似求解法 (值函数近似法、策略梯度法和深度强化学习)。本书最后一部分为实践与前沿, 实践部分基于一个相同的例子实现了强化学习领域的主流基础算法, 前沿部分介绍了强化学习领域的最新研究进展。
- 333 __ |a 本书可作为理工科本科生、研究生的强化学习课程教材, 也可作为相关从业者掌握强化学习的入门参考书
- 410 _0 |1 2001 |a 面向新工科专业建设计算机系列教材 |i 人工智能
- 606 0_ |a 机器学习 |A ji qi xue xi |x 高等学校 |j 教材
- 701 _0 |a 袁莎 |A yuan sha |4 著
- 701 _0 |a 白朔天 |A bai shuo tian |4 著
- 701 _0 |a 唐杰 |A tang jie |4 著
- 801 _0 |a CN |b 湖北三新 |c 20211020
- 905 __ |a GDPTC |d TP181/209