机读格式显示(MARC)
- 000 00807nam0 2200229 450
- 010 __ |a 978-7-121-47661-7 |d CNY69.80
- 035 __ |a (A100000NLC)012946673
- 049 __ |a A100000NLC |b UCS01012533632 |c 012946673 |d NLC01
- 100 __ |a 20240529d2024 em y0chiy0110 ea
- 200 1_ |a 强化学习 |9 qiang hua xue xi |b 专著 |f 余欣航编著
- 210 __ |a 北京 |c 电子工业出版社 |d 2024
- 215 __ |a 12,267页 |c 图 |d 26cm
- 330 __ |a 本书共12章,包括强化学习概述、马尔可夫决策过程、退化的强化学习问题、环境已知的强化学习问题、基于价值的强化学习算法、基于策略的强化学习算法、AC型算法、基于模型的强化学习算法等相关知识。
- 701 _0 |a 余欣航 |9 yu xin hang |4 编著