机读格式显示(MARC)
- 000 01166oam2 2200289 450
- 010 __ |a 978-7-302-53829-5 |d CNY99.00
- 100 __ |a 20200620d2020 em y0chiy50 ea
- 200 1_ |a 强化学习 |9 qiang hua xue xi |b 专著 |d Reinforcement learning |f 邹伟,鬲玲,刘昱杓著 |z eng
- 210 __ |a 北京 |c 清华大学出版社 |d 2020
- 215 __ |a 17,380页 |c 图 |d 24cm
- 330 __ |a 本书描述了强化学习的起源、背景和分类,各类强化学习算法的原理、实现方式以及各算法间的关系,为读者构建了一个完整的强化学习知识体系;同时包含经典案例,如各类迷官寻宝、飞翔小鸟、扑克牌、小车爬山、倒立摆、钟摆、多臂赌博机、五子棋、AlphaGo、AlphaGo Zero、AlphaZero等,通过给出它们对应的案例说明和代码描述,让读者理解各类强化学习算法的精髓。
- 461 _0 |1 2001 |a 人工智能科学与技术丛书
- 510 1_ |a Reinforcement learning |z eng
- 701 _0 |a 邹伟 |9 zou wei |c (人工智能) |4 著
- 701 _0 |a 鬲玲 |9 ge ling |4 著
- 701 _0 |a 刘昱杓 |9 liu yu biao |4 著
- 801 _0 |a CN |b GDPTC |c 20210629
- 905 __ |a GDPTC |d TP181/74