强化学习：原理与Python实战最新章节全文无弹窗在线阅读-QQ阅读女频幻言网

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面，深入介绍了主流强化学习理论和算法，覆盖资格迹等经典算法和MuZero等深度强化学习算法；实战方面，每章都配套了编程案例，以方便读者学习。全书从逻辑上分为三部分。第1章：从零开始介绍强化学习的背景知识，介绍环境库Gym的使用。第2～15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论，进而在理论的基础上讲解算法，并为算法提供配套代码实现。基础理论的讲解突出主干部分，算法讲解全面覆盖主流的强化学习算法，包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应，还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章：介绍其他强化学习模型，包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等，以便更好了解强化学习研究的全貌。

品牌：机械工业出版社

上架时间：2023-08-01 00:00:00

出版社：机械工业出版社

本书数字版权由机械工业出版社提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清

主页

会员
强化学习：原理与Python实现
全书分为三个部分。第一部分了解强化学习应用，了解强化学习基本知识，搭建强化学习测试环境。该部分包括：强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分：Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论；深度强化学习算法部分：详细剖析全部具有重要影响力的深度强
肖智清程序设计12.2万字

强化学习：原理与Python实战

最新章节

强化学习：原理与Python实现

AI战略：更好的人类体验与企业成功框架

分布式人工智能

智能工程

深度学习时代的计算机视觉算法

人工智能编程实践：Python编程5级

华为MindSpore深度学习框架应用开发实战

硅基物语·AI写作高手：从零开始用ChatGPT学会写作

图解大模型：生成式AI原理与实战

深度学习与大模型基础

妙用DeepSeek：创意落地速通指南

设计深度学习系统

巧用ChatGPT快速提高职场晋升力

法律人AI指南：大模型10倍提升工作效率的方法与技巧

AIGC驱动工业智能设备：系统设计与行业实践

DeepSeek实战：从提示词到部署和实践

DeepSeek高效提问指南：提出好问题，才有好答案