《大模型基础》浙江大学开源电子教材

图书价格：0.00

发布时间：2025-09-17 电子书大小：94.4 MB

发布者：AI铺子电子书格式：pdf

书籍简介

《大模型基础》是由浙江大学(毛玉仁,高云君等)编写的开源电子教材，专为对大语言模型（LLMs）感兴趣的读者打造。本书以系统讲解大模型基础知识、介绍前沿技术为核心目标，作者团队会积极吸纳开源社区及专家学者的建议，实行月度持续更新，致力于构建一本易读、严谨且有深度的大模型领域权威教材。

为增强内容的易读性，书中每章均以一种动物为背景对技术进行举例阐释，因此封面融合了六种动物元素。教材内容源于作者团队在大模型相关方向的探索与实践总结，同时针对每章配备了跟踪技术最新进展的Paper List。当前已发布第一版，后续还将陆续补充大模型推理加速、大模型智能体等方向的内容，封面动物也将随章节扩充而不断增加。

（一）知识体系：从基础到前沿的完整覆盖

本书第一版构建了“基础铺垫 - 核心架构 - 实用技术 - 应用拓展”的四层知识体系。第1章作为基础入门，梳理了语言模型的发展脉络，从传统统计方法切入，依次讲解RNN、Transformer等关键模型架构，同时涵盖采样方法与评测体系，为读者搭建起语言模型的基础认知框架。

第2章聚焦大语言模型本身，先阐释“大数据+大模型”催生新智能的核心逻辑，再系统剖析Encoder-only、Encoder-Decoder、Decoder-only三类主流架构及非Transformer架构的特点与应用场景，帮助读者理解大模型的技术根基。

第3至6章则深入大模型实践核心技术领域：Prompt工程章节详解上下文学习、思维链等核心技巧及应用落地；参数高效微调章节围绕参数附加、选择、低秩适配等方法展开，解决大模型微调成本高的痛点；模型编辑章节介绍经典方法及T-Patcher、ROME等代表性技术，实现模型知识的精准修正与更新；检索增强生成章节从架构、知识检索到生成增强进行全流程解析，突破大模型知识滞后、易 hallucinate 的局限。

（二）内容呈现：专业与通俗的平衡

在专业性上，内容均源自作者团队的实战探索，章节划分逻辑严谨，技术讲解深入且贴合学术前沿，同时每章配套的Paper List为读者提供了追踪技术演进的权威路径。在通俗性上，创新采用“动物背景举例”的方式，将抽象的技术概念与具象场景结合，降低了学习门槛，兼顾了学术深度与阅读体验。

（三）资源支持：多维度的学习保障

当前提供完整的PDF版本（路径为大模型基础.pdf），同时设有“大语言模型分章节内容文件夹”（含各章节独立PDF）和“大语言模型相关论文文件夹”（含各章节配套论文，持续更新）。读者可根据需求灵活获取资源，且能通过提交issue反馈问题，作者团队会据此优化内容，形成“创作-反馈-迭代”的良性循环。

图书目录

章节	所含内容
第 1 章：语言模型基础	1.1 基于统计方法的语言模型 1.2 基于 RNN 的语言模型 1.3 基于 Transformer 的语言模型 1.4 语言模型的采样方法 1.5 语言模型的评测
第 2 章：大语言模型	2.1 大数据 + 大模型 → 新智能 2.2 大语言模型架构概览 2.3 基于 Encoder-only 架构的大语言模型 2.4 基于 Encoder-Decoder 架构的大语言模型 2.5 基于 Decoder-only 架构的大语言模型 2.6 非 Transformer 架构
第 3 章：Prompt 工程	3.1 Prompt 工程简介 3.2 上下文学习 3.3 思维链 3.4 Prompt 技巧 3.5 相关应用
第 4 章：参数高效微调	4.1 参数高效微调简介 4.2 参数附加方法 4.3 参数选择方法 4.4 低秩适配方法 4.5 实践与应用
第 5 章：模型编辑	5.1 模型编辑简介 5.2 模型编辑经典方法 5.3 附加参数法：T-Patcher 5.4 定位编辑法：ROME 5.5 模型编辑应用
第 6 章：检索增强生成	6.1 检索增强生成简介 6.2 检索增强生成架构 6.3 知识检索 6.4 生成增强 6.5 实践与应用

适合人群

高校相关专业学生：计算机科学、人工智能、自然语言处理等专业的本科生、研究生，可借助本书系统构建大模型知识体系，为课程学习和科研入门奠定基础。
行业技术从业者：从事AI研发、大模型应用落地、NLP相关工作的工程师，能通过本书深入掌握Prompt工程、参数微调等实用技术，解决实际业务中的技术难题。
大模型领域研究者：关注大模型技术演进的科研人员，可依托书中的知识框架和配套论文列表，快速把握领域核心进展，明确研究方向。
大模型爱好者与入门者：对大语言模型原理、技术及应用感兴趣的非专业人士，本书的易读性设计能帮助其跨越专业壁垒，实现从入门到进阶的学习。

总结

《大模型基础》是一本兼具权威性、系统性与实用性的大语言模型开源教材，既为初学者搭建了清晰的知识框架，也为进阶者提供了深入探索的技术路径。其创新的内容呈现方式、持续迭代的更新机制以及丰富的配套资源，使其成为连接理论与实践、贯通入门与前沿的优质学习载体。无论是高校学生、行业从业者，还是科研人员与爱好者，都能从本书中获得精准的知识补给与实用的技术指导，是大模型领域不可多得的入门与进阶佳作。随着后续内容的不断扩充，本书的价值也将持续提升，值得长期关注与研读。