从零开始大模型开发与微调:基于PyTorch与ChatGLM在线阅读
会员

从零开始大模型开发与微调:基于PyTorch与ChatGLM

王晓华
开会员,本书免费读 >

计算机网络人工智能12.8万字

更新时间:2024-12-31 17:38:36 最新章节:18.5 本章小结

立即阅读
加书架
下载
听书

书籍简介

大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建、从零开始学习PyTorch2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习,也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。
品牌:清华大学
上架时间:2023-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

王晓华
主页

同类热门书

最新上架

  • 会员
    本书深度探讨了构建和训练ChatGPT模型涉及的核心技术,以及ChatGPT在各种实际应用中的作用。全书精心划分为三部分,其中第1章为第1部分,第2章为第2部分,第3章和第4章为第3部分。首先,详细阐述了机器学习的历史演变与各种学习范式,同时也揭示了在人工智能生成内容(AIGC)领域下,图像处理和自然语言处理技术的历史发展趋势;接下来,对ChatGPT的运行机制和关键算法进行深度解析,包括大规模模
    邱才明 凌泽南 冯湛搏 杨昊编著计算机10.8万字
  • 会员
    近年来,在自然语言处理领域,基于预训练语言模型的方法已形成全新范式。本书内容分为基础知识、预训练语言模型,以及实践与应用3个部分,共9章。第一部分全面、系统地介绍自然语言处理、神经网络和预训练语言模型的相关知识。第二部分介绍几种具有代表性的预训练语言模型的原理和机制(涉及注意力机制和Transformer模型),包括BERT及其变种,以及近年来发展迅猛的GPT和提示工程。第三部分介绍了基于Lang
    徐双双编著计算机12.7万字
  • 会员
    本书参照产业界自动驾驶技术研发的基本流程,充分借鉴了产业界在自动驾驶技术领域中的实际研发经验,以高性能的智能小车和高度仿真的车道沙盘为实验教具和运行环境,深入浅出地讲解自动驾驶技术的原理与实际应用,为初学者打开一扇通往人工智能世界的大门。本书以帮助初学者如何从无到有地打造出具备自动驾驶功能的智能小车为主线,内容分为看车(了解自动驾驶)、造车(设计智能小车)、开车(收集训练数据)、写车(编写自动驾驶
    胡波主编计算机14.9万字
  • 会员
    量子计算与人工智能的交叉融合,促使量子人工智能的不断发展。本书旨在采用对深度学习爱好者友好的方式,构建量子人工智能应用。全书共13章,第1章和第2章系统介绍量子计算机发展脉络和量子计算编程的基础知识。第3~7章分别介绍不同的深度学习方法和在这些算法逻辑上构建量子启发算法的方式,用量子线路中的相位作为神经网络的可学习参数,重构为量子神经网络算子。这些算子可以在PyTorch环境中直接调用。第8章和第
    金贤敏 胡俊杰编著计算机7.6万字
  • 会员
    在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次
    王鼎 赵明明 哈明鸣 任进计算机8.7万字
  • 会员
    DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合
    未来智能实验室 代晶编著计算机17万字
  • 会员
    本书兼顾机器学习基础、经典方法和深度学习方法,对组成机器学习的基础知识和基本算法进行了比较细致的介绍,对广泛应用的经典算法如线性回归、逻辑回归、朴素贝叶斯、支持向量机、决策树和集成学习等算法都给出了深入的分析并讨论了无监督学习的基本方法,对深度学习和强化学习进行了全面的叙述,比较深入地讨论了反向传播算法、多层感知机、CNN、RNN和LSTM等深度神经网络的核心知识和结构;对于强化学习,不仅介绍了经
    张旭东编著计算机20.6万字
  • 会员
    本书深入剖析了图神经网络领域所面临的两大核心挑战:深度加深模型退化和监督信息过度依赖。针对这两大挑战,本书提出了一系列解决思路,涵盖模型结构设计、训练策略优化等方面的内容。全书共7章,第1章主要介绍了图神经网络研究的背景与意义,阐述了近年来国内外网络表示学习与图神经网络的研究现状,分析了图神经网络当前面临的挑战及其主要问题等;第2章主要对图神经网络进行概要论述,包括基础的理论、典型的模型方法及应用
    王杰计算机8.1万字
  • 会员
    《AIGC:让生成式AI成为自己的外脑》针对近期较为火热的AIGC技术及其相关话题,介绍AIGC的技术原理、专业知识和应用。全书共分为九章。第一章介绍AIGC技术的基本概念和发展历程;第二、三章介绍AIGC的基础技术栈和拓展技术栈;第四、五章分别讨论了AIGC技术在文本生成和图像生成两个领域的现状和前景;第六章列举了目前较为热门的AIGC技术应用;第七章描述了AIGC的上、中、下游产业链及未来前景
    成生辉计算机12.8万字