江季王琦杨毅远

完结作品(1)

Joy RL：强化学习实践教程

本书是继《EasyRL：强化学习教程》（俗称“蘑菇书”）之后，为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验，涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容，旨在帮助读者快速入门强化学习的代码实践，并辅以一套开源代码框架“Joy

人工智能7.8万字

江季 王琦 杨毅远

完结作品(1)

Joy RL：强化学习实践教程

江季王琦杨毅远