机读格式显示(MARC)

000 01166oam2 2200289 450

001 0000197906

005 20210629185000.0

010 __ |a 978-7-302-53829-5 |d CNY99.00

100 __ |a 20200620d2020 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 强化学习 |9 qiang hua xue xi |b 专著 |d Reinforcement learning |f 邹伟，鬲玲，刘昱杓著 |z eng

210 __ |a 北京 |c 清华大学出版社 |d 2020

215 __ |a 17,380页 |c 图 |d 24cm

225 2_ |a 人工智能科学与技术丛书

330 __ |a 本书描述了强化学习的起源、背景和分类，各类强化学习算法的原理、实现方式以及各算法间的关系，为读者构建了一个完整的强化学习知识体系；同时包含经典案例，如各类迷官寻宝、飞翔小鸟、扑克牌、小车爬山、倒立摆、钟摆、多臂赌博机、五子棋、AlphaGo、AlphaGo Zero、AlphaZero等，通过给出它们对应的案例说明和代码描述，让读者理解各类强化学习算法的精髓。

461 _0 |1 2001 |a 人工智能科学与技术丛书

510 1_ |a Reinforcement learning |z eng

606 0_ |a 机器学习

690 __ |a TP181 |v 5

701 _0 |a 邹伟 |9 zou wei |c (人工智能) |4 著

701 _0 |a 鬲玲 |9 ge ling |4 著

701 _0 |a 刘昱杓 |9 liu yu biao |4 著

801 _0 |a CN |b GDPTC |c 20210629

905 __ |a GDPTC |d TP181/74