强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

同类热门书

最新上架

  • 会员
    本书从写作与ChatGPT的基础知识讲起,结合创作者的实际写作经历与写作教学经历,介绍了用ChatGPT写作的基础技巧、进阶写作的方法、不同文体的写作方法、写作变现的秘诀,让读者理解写作技巧与变现思路。
    无戒 杜培培 俞庚言计算机14.7万字
  • 会员
    本书全程图解式讲解,通过大量全彩插图拆解概念,让读者真正告别学习大模型的枯燥和复杂。全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分理解语言模型(第1~3章),解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分使用预训练语言模型(第4~9章),介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。第
    (沙特)杰伊·阿拉马尔 (荷)马尔滕·格鲁滕多斯特计算机16.4万字
  • 会员
    本书从基础的神经网络、卷积神经网络、循环神经网络等入门知识,到深度学习的应用领域如计算机视觉、自然语言处理等高级主题都有涉及,可以帮助读者更好地理解深度学习知识,并为未来的职业发展打下坚实的基础。
    段小手计算机23.6万字
  • 会员
    在人工智能技术快速发展的时代,DeepSeek?作为国产自研的高性能?AI模型,在多领域得到广泛应用。本书是关于DeepSeek的实践指南,分为基础认知、开发实战、高能应用3篇。基础认知篇介绍DeepSeek的核心功能、使用方法与对话技巧;开发实战篇讲解DeepSeekAPI的申请与使用,以及部署方法;高能应用篇展示DeepSeek在多媒体生成、办公软件、智能助手方面的应用。本书内容由浅入深,涵
    李艮基 曹方咏峥 肖灵儿编著计算机3.3万字
  • 会员
    本书主要从软件开发者的角度探讨如何构建和设计深度学习系统。作者首先描述一个典型的深度学习系统的整体,包括其主要组件以及它们之间的连接方式,然后在各个单独的章节中深入探讨这些主要组件。对于具体介绍的章节,会在开始时讨论需求,接着介绍设计原则和示例服务/代码,并评估开源解决方案。通过阅读本书,读者将能够了解深度学习系统的工作原理,以及如何开发每个组件。本书的主要读者对象是想要从事深度学习平台工作或将一
    (美)王迟 (美)司徒杰鹏计算机18.1万字
  • 会员
    本书共分为10章,从ChatGPT的基本知识、技术原理和应用场景出发,探讨了如何运用ChatGPT提升职场竞争力。
    朱宁计算机11.4万字
  • 会员
    本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章,分为五部分。第一部分(第1章)介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景,并深入探讨了AI对法律行业带来的影响等。第二部分(第2~6章)针对法律人的主要工作任务,包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等,详细讲解了应该如何使用AI来提升工作效率。第三部分(第7
    张萌 李小武 兰洋 陈中泽等计算机23.8万字
  • 会员
    (1)AI与AIGC基础知识:从基础入手,深入讲解AI技术的基本概念和原理。通过通俗易懂的讲解和示例,帮助读者建立坚实的理论基础,为后续章节的深入学习打下良好基础。(2)智能设备上的AIGC系统设计:详细介绍AIGC技术在实际应用过程中的各种功能设计和实现方法。内容涵盖算法选择、模型训练、系统集成等各个环节,通过丰富的技术细节和设计策略,帮助读者全面掌握AIGC技术的应用要点。(3)AIGC关键工
    刘冰计算机18万字
  • 会员
    本书旨在提供一份全面、易懂的DeepSeek大模型实战内容,通过深入浅出的讲解,帮助读者快速掌握DeepSeek的核心技术和应用场景。本书不仅涵盖了DeepSeek的技术原理、架构设计和训练方法,还详细介绍了如何通过API调用、本地部署和云服务等方式将DeepSeek集成到实践项目中。此外,本书通过大量实例和案例分析,展示了DeepSeek在不同领域的应用实践,帮助读者更好地理解和应用这一强大的工
    张成文编著计算机9万字

同类书籍最近更新

  • 如今,以DeepSeek为代表的AI工具迅速崛起,深刻地改变了人类获取与处理信息的方式。但在应用DeepSeek的过程中,很多人发现,向DeepSeek提出问题后,得到的回复往往不尽如人意,或是过于宽泛、缺乏针对性,或是未能切中要点、不能解决实际问题。导致这一问题的根本原因是,提问者缺乏有效的提问技巧,无法精准引导AI发挥强大的运算与分析能力。《DeepSeek高效提问指南》正是针对这一痛点,构建
    马超编著人工智能11.4万字