
《大模型基础》浙江大学开源电子教材
书籍简介
《大模型基础》是由浙江大学(毛玉仁,高云君等)编写的开源电子教材,专为对大语言模型(LLMs)感兴趣的读者打造。本书以系统讲解大模型基础知识、介绍前沿技术为核心目标,作者团队会积极吸纳开源社区及专家学者的建议,实行月度持续更新,致力于构建一本易读、严谨且有深度的大模型领域权威教材。
为增强内容的易读性,书中每章均以一种动物为背景对技术进行举例阐释,因此封面融合了六种动物元素。教材内容源于作者团队在大模型相关方向的探索与实践总结,同时针对每章配备了跟踪技术最新进展的Paper List。当前已发布第一版,后续还将陆续补充大模型推理加速、大模型智能体等方向的内容,封面动物也将随章节扩充而不断增加。
(一)知识体系:从基础到前沿的完整覆盖
本书第一版构建了“基础铺垫 - 核心架构 - 实用技术 - 应用拓展”的四层知识体系。第1章作为基础入门,梳理了语言模型的发展脉络,从传统统计方法切入,依次讲解RNN、Transformer等关键模型架构,同时涵盖采样方法与评测体系,为读者搭建起语言模型的基础认知框架。
第2章聚焦大语言模型本身,先阐释“大数据+大模型”催生新智能的核心逻辑,再系统剖析Encoder-only、Encoder-Decoder、Decoder-only三类主流架构及非Transformer架构的特点与应用场景,帮助读者理解大模型的技术根基。
第3至6章则深入大模型实践核心技术领域:Prompt工程章节详解上下文学习、思维链等核心技巧及应用落地;参数高效微调章节围绕参数附加、选择、低秩适配等方法展开,解决大模型微调成本高的痛点;模型编辑章节介绍经典方法及T-Patcher、ROME等代表性技术,实现模型知识的精准修正与更新;检索增强生成章节从架构、知识检索到生成增强进行全流程解析,突破大模型知识滞后、易 hallucinate 的局限。
(二)内容呈现:专业与通俗的平衡
在专业性上,内容均源自作者团队的实战探索,章节划分逻辑严谨,技术讲解深入且贴合学术前沿,同时每章配套的Paper List为读者提供了追踪技术演进的权威路径。在通俗性上,创新采用“动物背景举例”的方式,将抽象的技术概念与具象场景结合,降低了学习门槛,兼顾了学术深度与阅读体验。
(三)资源支持:多维度的学习保障
当前提供完整的PDF版本(路径为大模型基础.pdf),同时设有“大语言模型分章节内容文件夹”(含各章节独立PDF)和“大语言模型相关论文文件夹”(含各章节配套论文,持续更新)。读者可根据需求灵活获取资源,且能通过提交issue反馈问题,作者团队会据此优化内容,形成“创作-反馈-迭代”的良性循环。
图书目录
章节 | 所含内容 |
---|---|
第 1 章:语言模型基础 |
1.1 基于统计方法的语言模型 1.2 基于 RNN 的语言模型 1.3 基于 Transformer 的语言模型 1.4 语言模型的采样方法 1.5 语言模型的评测 |
第 2 章:大语言模型 |
2.1 大数据 + 大模型 → 新智能 2.2 大语言模型架构概览 2.3 基于 Encoder-only 架构的大语言模型 2.4 基于 Encoder-Decoder 架构的大语言模型 2.5 基于 Decoder-only 架构的大语言模型 2.6 非 Transformer 架构 |
第 3 章:Prompt 工程 |
3.1 Prompt 工程简介 3.2 上下文学习 3.3 思维链 3.4 Prompt 技巧 3.5 相关应用 |
第 4 章:参数高效微调 |
4.1 参数高效微调简介 4.2 参数附加方法 4.3 参数选择方法 4.4 低秩适配方法 4.5 实践与应用 |
第 5 章:模型编辑 |
5.1 模型编辑简介 5.2 模型编辑经典方法 5.3 附加参数法:T-Patcher 5.4 定位编辑法:ROME 5.5 模型编辑应用 |
第 6 章:检索增强生成 |
6.1 检索增强生成简介 6.2 检索增强生成架构 6.3 知识检索 6.4 生成增强 6.5 实践与应用 |
适合人群
高校相关专业学生:计算机科学、人工智能、自然语言处理等专业的本科生、研究生,可借助本书系统构建大模型知识体系,为课程学习和科研入门奠定基础。
行业技术从业者:从事AI研发、大模型应用落地、NLP相关工作的工程师,能通过本书深入掌握Prompt工程、参数微调等实用技术,解决实际业务中的技术难题。
大模型领域研究者:关注大模型技术演进的科研人员,可依托书中的知识框架和配套论文列表,快速把握领域核心进展,明确研究方向。
大模型爱好者与入门者:对大语言模型原理、技术及应用感兴趣的非专业人士,本书的易读性设计能帮助其跨越专业壁垒,实现从入门到进阶的学习。
推荐理由
权威性与专业性兼具:由浙江大学(毛玉仁,高云君等)倾力打造,内容基于实战探索,知识体系严谨,配套论文列表紧跟前沿,为学习和研究提供权威指引。
内容设计贴合学习需求:从基础到前沿的递进式章节安排,兼顾专业深度与通俗表达,动物举例的创新形式大幅提升了内容易读性,适配不同层次读者的学习节奏。
动态更新与互动性强:实行月度持续更新,将不断补充推理加速、智能体等热门内容,同时开放issue反馈通道,读者可参与内容优化,保障知识的时效性与实用性。
资源丰富且获取便捷:提供完整PDF、分章节PDF及配套论文等多维度资源,获取路径清晰,能满足碎片化学习、系统研读、科研参考等多种需求。
实用性与指导性突出:聚焦Prompt工程、参数高效微调等落地性强的技术,章节设有“实践与应用”模块,可直接指导学生、从业者的实战操作。
总结
《大模型基础》是一本兼具权威性、系统性与实用性的大语言模型开源教材,既为初学者搭建了清晰的知识框架,也为进阶者提供了深入探索的技术路径。其创新的内容呈现方式、持续迭代的更新机制以及丰富的配套资源,使其成为连接理论与实践、贯通入门与前沿的优质学习载体。无论是高校学生、行业从业者,还是科研人员与爱好者,都能从本书中获得精准的知识补给与实用的技术指导,是大模型领域不可多得的入门与进阶佳作。随着后续内容的不断扩充,本书的价值也将持续提升,值得长期关注与研读。
下载电子书
下载地址版权及免责申明:本文由@AI铺子原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-books/foundations-of-llms.html