《大模型基础》浙江大学开源电子教材封面

《大模型基础》浙江大学开源电子教材

图书价格:0.00
发布时间: 电子书大小:94.4 MB
电子书格式:pdf

书籍简介

大模型基础》是由浙江大学(毛玉仁,高云君等)编写的开源电子教材,专为对大语言模型(LLMs)感兴趣的读者打造。本书以系统讲解大模型基础知识、介绍前沿技术为核心目标,作者团队会积极吸纳开源社区及专家学者的建议,实行月度持续更新,致力于构建一本易读、严谨且有深度的大模型领域权威教材。

为增强内容的易读性,书中每章均以一种动物为背景对技术进行举例阐释,因此封面融合了六种动物元素。教材内容源于作者团队在大模型相关方向的探索与实践总结,同时针对每章配备了跟踪技术最新进展的Paper List。当前已发布第一版,后续还将陆续补充大模型推理加速、大模型智能体等方向的内容,封面动物也将随章节扩充而不断增加。

(一)知识体系:从基础到前沿的完整覆盖

本书第一版构建了“基础铺垫 - 核心架构 - 实用技术 - 应用拓展”的四层知识体系。第1章作为基础入门,梳理了语言模型的发展脉络,从传统统计方法切入,依次讲解RNN、Transformer等关键模型架构,同时涵盖采样方法与评测体系,为读者搭建起语言模型的基础认知框架。

第2章聚焦大语言模型本身,先阐释“大数据+大模型”催生新智能的核心逻辑,再系统剖析Encoder-only、Encoder-Decoder、Decoder-only三类主流架构及非Transformer架构的特点与应用场景,帮助读者理解大模型的技术根基。

第3至6章则深入大模型实践核心技术领域:Prompt工程章节详解上下文学习、思维链等核心技巧及应用落地;参数高效微调章节围绕参数附加、选择、低秩适配等方法展开,解决大模型微调成本高的痛点;模型编辑章节介绍经典方法及T-Patcher、ROME等代表性技术,实现模型知识的精准修正与更新;检索增强生成章节从架构、知识检索到生成增强进行全流程解析,突破大模型知识滞后、易 hallucinate 的局限。

(二)内容呈现:专业与通俗的平衡

在专业性上,内容均源自作者团队的实战探索,章节划分逻辑严谨,技术讲解深入且贴合学术前沿,同时每章配套的Paper List为读者提供了追踪技术演进的权威路径。在通俗性上,创新采用“动物背景举例”的方式,将抽象的技术概念与具象场景结合,降低了学习门槛,兼顾了学术深度与阅读体验。

(三)资源支持:多维度的学习保障

当前提供完整的PDF版本(路径为大模型基础.pdf),同时设有“大语言模型分章节内容文件夹”(含各章节独立PDF)和“大语言模型相关论文文件夹”(含各章节配套论文,持续更新)。读者可根据需求灵活获取资源,且能通过提交issue反馈问题,作者团队会据此优化内容,形成“创作-反馈-迭代”的良性循环。

图书目录

章节 所含内容
第 1 章:语言模型基础 1.1 基于统计方法的语言模型
1.2 基于 RNN 的语言模型
1.3 基于 Transformer 的语言模型
1.4 语言模型的采样方法
1.5 语言模型的评测
第 2 章:大语言模型 2.1 大数据 + 大模型 → 新智能
2.2 大语言模型架构概览
2.3 基于 Encoder-only 架构的大语言模型
2.4 基于 Encoder-Decoder 架构的大语言模型
2.5 基于 Decoder-only 架构的大语言模型
2.6 非 Transformer 架构
第 3 章:Prompt 工程 3.1 Prompt 工程简介
3.2 上下文学习
3.3 思维链
3.4 Prompt 技巧
3.5 相关应用
第 4 章:参数高效微调 4.1 参数高效微调简介
4.2 参数附加方法
4.3 参数选择方法
4.4 低秩适配方法
4.5 实践与应用
第 5 章:模型编辑 5.1 模型编辑简介
5.2 模型编辑经典方法
5.3 附加参数法:T-Patcher
5.4 定位编辑法:ROME
5.5 模型编辑应用
第 6 章:检索增强生成 6.1 检索增强生成简介
6.2 检索增强生成架构
6.3 知识检索
6.4 生成增强
6.5 实践与应用

适合人群

  1. 高校相关专业学生:计算机科学、人工智能、自然语言处理等专业的本科生、研究生,可借助本书系统构建大模型知识体系,为课程学习和科研入门奠定基础。

  2. 行业技术从业者:从事AI研发、大模型应用落地、NLP相关工作的工程师,能通过本书深入掌握Prompt工程、参数微调等实用技术,解决实际业务中的技术难题。

  3. 大模型领域研究者:关注大模型技术演进的科研人员,可依托书中的知识框架和配套论文列表,快速把握领域核心进展,明确研究方向。

  4. 大模型爱好者与入门者:对大语言模型原理、技术及应用感兴趣的非专业人士,本书的易读性设计能帮助其跨越专业壁垒,实现从入门到进阶的学习。

推荐理由

  1. 权威性与专业性兼具:由浙江大学(毛玉仁,高云君等)倾力打造,内容基于实战探索,知识体系严谨,配套论文列表紧跟前沿,为学习和研究提供权威指引。

  2. 内容设计贴合学习需求:从基础到前沿的递进式章节安排,兼顾专业深度与通俗表达,动物举例的创新形式大幅提升了内容易读性,适配不同层次读者的学习节奏。

  3. 动态更新与互动性强:实行月度持续更新,将不断补充推理加速、智能体等热门内容,同时开放issue反馈通道,读者可参与内容优化,保障知识的时效性与实用性。

  4. 资源丰富且获取便捷:提供完整PDF、分章节PDF及配套论文等多维度资源,获取路径清晰,能满足碎片化学习、系统研读、科研参考等多种需求。

  5. 实用性与指导性突出:聚焦Prompt工程、参数高效微调等落地性强的技术,章节设有“实践与应用”模块,可直接指导学生、从业者的实战操作。

总结

《大模型基础》是一本兼具权威性、系统性与实用性的大语言模型开源教材,既为初学者搭建了清晰的知识框架,也为进阶者提供了深入探索的技术路径。其创新的内容呈现方式、持续迭代的更新机制以及丰富的配套资源,使其成为连接理论与实践、贯通入门与前沿的优质学习载体。无论是高校学生、行业从业者,还是科研人员与爱好者,都能从本书中获得精准的知识补给与实用的技术指导,是大模型领域不可多得的入门与进阶佳作。随着后续内容的不断扩充,本书的价值也将持续提升,值得长期关注与研读。

下载电子书

下载地址
打赏
THE END
作者头像
AI铺子
关注ai行业发展,专注ai工具推荐