ChatGPT原理与架构:大模型的预训练、迁移和中间件编程在线阅读
会员

ChatGPT原理与架构:大模型的预训练、迁移和中间件编程

程戈
开会员,本书免费读 >

计算机网络人工智能10.6万字

更新时间:2024-04-25 18:20:57 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

程戈
主页

同类热门书

最新上架

  • 会员
    本书聚焦如何高效运用DeepSeek这一前沿AI工具,帮助读者在技术浪潮中把握机遇。全书从DeepSeek发展历程切入,系统解析DeepSeek在信息处理、创意生成与决策辅助中的核心能力,并结合生活管理、职场协作、学习优化、社交互动等场景,通过真实案例讲解其应用方法。同时,针对内容创作、自媒体运营、副业变现等需求,书中提供了可落地的策略与案例,助力读者实现效率提升与价值创造。书中不仅提供技术使用技
    何华平编著计算机5.5万字
  • 会员
    本书从技术、应用和产业3个维度为切入点,对智能语音语义领域相关的热点和趋势展开研究。本书以“人与机器的对话”开篇,讲述人类语音生成、传播和感知的过程,引发对于机器智能语音听说的思考,进而阐述技术探索发展史;然后,分析了以语音交互为核心的技术现状,综合剖析提出全双工、端到端模型构建、语音假冒攻击等热点;其次,从政策、投融资和产业规模上,分析整体智能语音产业环境,纵观国内外企业在相关技术和产品上的积极
    李荪 曾然然 殷治纲编著计算机13.6万字
  • 会员
    本书结合作者10多年写作经验,基于AI应用ChatGPT、文心一言、智谱清言、讯飞星火、通义千问、Kimi等,详细介绍了使用AI写作的流程、方法和技巧,旨在帮助想要通过内容输出加速个人发展的读者,快速掌握AI自媒体写作的方法和技巧。本书分为11章,涵盖AI自媒体写作概述、AI提示词、AI起标题、AI做选题、AI角色化写作、AI套路化写作、AI仿写、AI模块化写作、AI改写、AI润色、AI智能体写作
    安晓辉计算机9.2万字
  • 会员
    本书共14章,主要内容包括探索性数据分析、有监督学习(线性回归、SVM、决策树等)、无监督学习(降维、聚类等),以及深度学习的基础原理和应用等。
    段小手计算机18万字
  • 会员
    本书分为23章,从基础的演讲知识入手,到演讲稿的写作技巧,再到指导读者如何有效地利用ChatGPT进行演讲稿写作和演讲练习,最后通过实际的行业案例进行深入的学习和实战应用。使读者不仅可以学习演讲的相关知识,还能对如何利用ChatGPT进行有效的演讲有所理解。
    刘萌雪 赵建涛 屈高翔计算机19.1万字
  • 会员
    本书共16章,内容包括人工智能、OpenAI、ChatGPT的概述及其操作技巧。生动展示了ChatGPT在教育与学术、商业管理、新媒体、办公、求职等12个领域的实际运用,同时探讨了ChatGPT当前面临的挑战以及大模型的未来发展方向。
    江涵丰计算机12万字
  • 会员
    本书共分为10章,从ChatGPT的基本知识、技术原理和应用场景出发,探讨了如何运用ChatGPT提升职场竞争力。
    朱宁计算机11.4万字
  • 会员
    本书讲解如何利用AI工具来高效制作和设计PPT,全书共分为8章,前面7章分别介绍了PPT不同制作内容的相关知识和技巧,包括软件操作层面、设计思维层面、素材应用层面的内容,第8章模拟了两个真实工作场景下的PPT使用需求,逐步讲解设计的关键环节,旨在帮助读者解决工作中的实际问题。
    凤凰高新教育编著计算机601字
  • 会员
    近年来,在自然语言处理领域,基于预训练语言模型的方法已形成全新范式。本书内容分为基础知识、预训练语言模型,以及实践与应用3个部分,共9章。第一部分全面、系统地介绍自然语言处理、神经网络和预训练语言模型的相关知识。第二部分介绍几种具有代表性的预训练语言模型的原理和机制(涉及注意力机制和Transformer模型),包括BERT及其变种,以及近年来发展迅猛的GPT和提示工程。第三部分介绍了基于Lang
    徐双双编著计算机12.7万字