
完结作品(1)
会员
本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“Joy
人工智能7.8万字
网站合作:傅女士 fuli.a@yuewen.com
双新用户(设备和账号都新为双新用户)下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天
Copyright (C) 2025 mbook.qq.com All Rights Reserved 上海阅文信息技术有限公司 版权所有
粤公网安备 44030002000001号 增值电信业务经营许可证:粤B2-20090059 互联网ICP备案号: 粤B2-20090059-5 沪ICP备14016804号-3 举报电话:010-59357051 营业执照
网络文化经营许可证:沪网文 (2023) 3296-228号 网络出版服务许可证:(署)网出证(沪)字第055号 互联网宗教信息服务许可证:沪(2023)0000015