强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

同类热门书

最新上架

  • 会员
    本书作为文心一言的学习指南,全面、细致地介绍了文心一言PC端和App的各项功能和使用方法,力求通过简洁明了的语言和图文并茂的形式,让读者快速掌握文心一言的各项功能。全书共8章,首先简单介绍了人工智能发展的几个阶段及文心一言的相关研发背景;随后介绍了文心一言的基础页面及功能等内容,以及文心一言在学习、工作、生活娱乐方面的应用及相关案例;接着介绍了文心一言的插件,以及文心一言App的功能和使用技巧;最
    麓山AI研习社编著计算机10.7万字
  • 会员
    人工智能作为数字经济及高精尖产业发展的原创性、引领性和代表性技术,在北京国际科技创新中心、全球数字经济标杆城市的建设中迎来了发展的“关键窗口期”和“政策红利期”,成为北京高质量发展的重要引擎和打造高质量就业“北京样板”的重大机遇。本书是一部经济学学术专著,书稿导向积极。本书采用多元数据来源,运用案例研究法、舆情分析与大数据分析法等多种研究方法,从产业与就业动态匹配视角,聚焦人工智能对北京市就业的影
    何勤计算机25.6万字
  • 会员
    《机器学习实战:视频教学版》基于Python语言详细讲解机器学习算法及其应用,用于读者快速入门机器学习。《机器学习实战:视频教学版》共分12章,内容包括机器学习概述、Python数据处理基础、Python常用机器学习库、线性回归及应用、分类算法及应用、数据降维及应用、聚类算法及应用、关联规则挖掘算法及应用、协同过滤算法及应用,最后通过3个综合实战项目(包括新闻内容分类实战、泰坦尼克号获救预测实战、
    迟殿委 王培进 王兴平计算机10.1万字
  • 会员
    《AIGC:让生成式AI成为自己的外脑》针对近期较为火热的AIGC技术及其相关话题,介绍AIGC的技术原理、专业知识和应用。全书共分为九章。第一章介绍AIGC技术的基本概念和发展历程;第二、三章介绍AIGC的基础技术栈和拓展技术栈;第四、五章分别讨论了AIGC技术在文本生成和图像生成两个领域的现状和前景;第六章列举了目前较为热门的AIGC技术应用;第七章描述了AIGC的上、中、下游产业链及未来前景
    成生辉计算机12.8万字
  • 会员
    《ChatGLM3大模型本地化部署、应用开发与微调》作为《PyTorch2.0深度学习从零开始学》的姊妹篇,专注于大模型的本地化部署、应用开发以及微调等。《ChatGLM3大模型本地化部署、应用开发与微调》不仅系统地阐述了深度学习大模型的核心理论,更注重实践应用,通过丰富的案例和场景,引导读者从理论走向实践,真正领悟和掌握大模型本地化应用的精髓。全书共分13章,全方位、多角度地展示了大模型本地化
    王晓华计算机13万字
  • 会员
    本书深入剖析了图神经网络领域所面临的两大核心挑战:深度加深模型退化和监督信息过度依赖。针对这两大挑战,本书提出了一系列解决思路,涵盖模型结构设计、训练策略优化等方面的内容。全书共7章,第1章主要介绍了图神经网络研究的背景与意义,阐述了近年来国内外网络表示学习与图神经网络的研究现状,分析了图神经网络当前面临的挑战及其主要问题等;第2章主要对图神经网络进行概要论述,包括基础的理论、典型的模型方法及应用
    王杰计算机8.1万字
  • 会员
    机器学习是人工智能的核心,而统计思维则是机器学习方法的核心:从随机性中寻找规律性。例如,利用损失最小化思想制定学习策略,采用概率最大化思想估计模型参数,利用方差对不确定性的捕捉构造k维树,采用贝叶斯公式构建分类决策模型,等等。只有树立正确的统计思维,才能准确高效地运用机器学习方法开展数据处理与分析。本书以统计思维的视角,揭示监督学习中回归和分类模型的核心思想,帮助读者构建理论体系。
    董平编著计算机18万字
  • 会员
    机器学习是计算机科学与人工智能的重要分支领域.本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面.全书共16章,大致分为3个部分:第1部分(第1~3章)介绍机器学习的基础知识;第2部分(第4~10章)讨论一些经典而常用的机器学习方法(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习);第3部分(第11~16章)为进阶知识,内容涉及特征选择与稀疏学习、计算
    周志华计算机22.7万字
  • 会员
    在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次
    王鼎 赵明明 哈明鸣 任进计算机8.7万字