零基础学AI大模型之LangChain链

AI教程 chandfy 8个月前

前情摘要：

零基础学AI大模型之LangChain链

1. 引言：为什么需要「Chain」？

在LangChain中，单个组件（如PromptTemplate、ChatOpenAI）只能解决单一问题：提示模板负责格式化输入，大模型负责生成内容，但实际AI应用往往需要多步骤协作——比如“接收用户问题→填充提示模板→调用大模型→解析输出结果→存储到数据库”。

「Chain（链）」正是为解决这一需求而生：它像一条“流水线”，将多个独立组件按逻辑顺序串联，形成可复用、可扩展的任务流程。类比Java中的责任链模式或工作流引擎，Chain让复杂AI任务的开发从“零散拼接”变成“标准化组装”。

零基础学AI大模型之LangChain链

2. 核心概念：什么是Chain？

2.1 Chain的定义

Chain是LangChain构建语言模型应用的核心组件，本质是「多个处理单元（模型/工具/逻辑）的有序组合」，用于实现端到端的任务流程。

2.2 用Java责任链模式类比理解

如果你熟悉Java，可以通过以下代码快速get Chain的设计思想：

// 1. 定义处理单元接口（类似LangChain的Runnable）
public interface Handler {
    void handle(Request request);
}

// 2. 实现具体处理单元（类似LangChain的Prompt、LLM、Parser）
class ValidationHandler implements Handler { 
    // 第一步：验证用户输入合法性
    @Override
    public void handle(Request request) {
        if (request.getContent() == null) {
            throw new IllegalArgumentException("输入不能为空");
        }
    }
}

class LLMProcessingHandler implements Handler { 
    // 第二步：调用大模型处理
    @Override
    public void handle(Request request) {
        String result = llmClient.generate(request.getContent());
        request.setLlmResult(result); // 传递结果给下一个单元
    }
}

class DatabaseSaveHandler implements Handler { 
    // 第三步：存储结果到数据库
    @Override
    public void handle(Request request) {
        dbClient.save(request.getLlmResult());
    }
}

// 3. 构建Chain并执行（类似LangChain的链组装）
public class ChainDemo {
    public static void main(String[] args) {
        List<Handler> chain = Arrays.asList(
            new ValidationHandler(),
            new LLMProcessingHandler(),
            new DatabaseSaveHandler()
        );
        
        Request request = new Request("如何学习AI大模型？");
        for (Handler handler : chain) {
            handler.handle(request); // 按顺序执行
        }
    }
}

2.3 Chain的核心价值

解耦组件：每个单元只负责单一职责（验证/生成/存储），便于维护和替换；
流程复用：定义好的Chain可在多个场景中重复调用（如“问答→存储”链）；
扩展灵活：可随时新增/删除处理单元（如在“生成”后加“结果脱敏”单元）。

3. 基础链实战：LLMChain

LLMChain是LangChain中最基础的链，专门用于“提示模板+大模型”的简单组合，负责“填充模板→调用模型→返回结果”的单步流程。

注意：LLMChain是旧版（LangChain 0.2及之前）的核心链，目前LangChain 0.3+已推荐使用LCEL，但LLMChain仍被保留，适合入门理解链的本质。

3.1 LLMChain的核心构成

LLMChain由3个核心部分组成，参数说明如下表：

参数名	作用	类比Java场景	示例值
llm	依赖的大模型实例	注入的第三方服务客户端	ChatOpenAI(model_name="qwen-plus")
prompt	预定义的提示词模板（含动态变量）	带占位符的String模板	PromptTemplate(input_variables=["product"], template="列举{product}的3个卖点")
output_parser	（可选）模型输出的后处理器	JSON解析工具（如Jackson）	CommaSeparatedListOutputParser()

3.2 LLMChain完整实战案例

3.2.1 环境准备

需先安装LangChain相关依赖：

pip install langchain langchain-openai

3.2.2 代码实现（含详细注释）

# 1. 导入依赖
from langchain_openai import ChatOpenAI
from langchain.chains import LLMChain
from langchain_core.prompts import PromptTemplate

# 2. 1 定义提示词模板（动态变量为product）
# 类似Java的String.format("列举%s的3个卖点", product)
prompt_template = PromptTemplate(
    input_variables=["product"],  # 声明动态变量
    template="你是文案高手，请列举{product}的3个核心卖点，每个卖点用简短短语描述："
)

# 2.2 初始化大模型（以阿里通义千问为例，需替换为自己的api_key）
model = ChatOpenAI(
    model_name='deepseek-r1:7b',  # 本地模型名称，根据实际情况填写
    base_url="http://127.0.0.1:11434/v1",  # 本地模型API地址
    api_key="none",  # 本地模型通常不需要真实API密钥
    temperature=0.7  # 可根据需要调整温度参数
)

# 3. 构建LLMChain（组装模板和模型）
llm_chain = LLMChain(
    llm=model,      # 注入模型
    prompt=prompt_template  # 注入提示模板
)

# 4. 调用链（注意：需传递包含动态变量的字典）
# 旧版run()方法已淘汰，LangChain 0.3+统一用invoke()
result = llm_chain.invoke({"product": "大模型"})  # 变量product赋值为"大模型"

# 5. 输出结果
print("LLMChain输出结果：")
print(result["text"])  # result是字典，key为"text"（默认输出键）

3.2.3 运行结果示例

LangChainDeprecationWarning: The class `LLMChain` was deprecated in LangChain 0.1.17 and will be removed in 1.0. Use :meth:`~RunnableSequence, e.g., `prompt | llm`` instead.
  llm_chain = LLMChain(
LLMChain输出结果：
<think>
嗯，用户让我帮忙作为文案高手，列出大模型的三个核心卖点，每个卖点用简短的话描述。首先，我需要明确用户的需求是什么。他们可能是在准备产品推广或者市场宣传，想突出大模型的主要优势。

接下来，我要考虑大模型最吸引人的地方通常是什么。数据驱动是关键，所以第一个卖点应该是“数据驱动”。这个点能突出模型有多强大，处理的信息量大，结果准确可靠。

然后，自然流畅的输出也很重要。用户可能经常需要处理文本，无论是写文案、翻译还是生成内容，自然语言的处理能力能让他们的工作更高效。所以第二个卖点是“自然流畅的输出”。

第三个卖点应该是计算速度方面。虽然数据驱动和自然输出很重要，但快速响应也是用户关注的重点，尤其是在需要即时反馈的情况下。因此，我想到“轻松应对复杂任务”作为第三个点。

最后，我要确保每个卖点都是简短而有力的，能够吸引读者的注意力并传达关键信息。这样用户的文案就能更好地突出大模型的优势了。
</think>

1. **数据驱动**  
   大模型基于海量数据，提供准确、可靠的内容生成与分析。  

2. **自然流畅的输出**  
   支持多种语言，精准理解用户意图，生成自然地道的语言内容。  

3. **轻松应对复杂任务**  
   灵活处理多种应用场景，快速响应专业或创意需求，满足多领域应用需求。

Process finished with exit code 0

零基础学AI大模型之LangChain链

3.3 LLMChain的适用场景

LLMChain仅适合简单的单步任务，例如：

生成某产品的文案/卖点；
翻译指定文本（模板为“将{text}翻译成英文”）；
给文章起标题（模板为“给{article_content}起3个标题”）。

局限性：无法实现多步骤流程（如“生成卖点→存储到Excel”），需用更复杂的链（如SequentialChain）或新版LCEL。

4. 新范式实战：LCEL（LangChain Expression Language）

LCEL是LangChain 0.3+推出的声明式编程语言，核心思想是用「管道符|」串联组件，替代旧版的类继承式链，解决了LLMChain的灵活性不足问题。

4.1 为什么需要LCEL？

旧版Chain（如LLMChain）存在以下痛点：

多组件组合繁琐（如“模板+模型+解析器”需手动封装）；
不支持流式响应（无法实现ChatGPT的“逐字输出”效果）；
同步/异步调用不统一（需分别处理同步run()和异步arun()）。

LCEL的核心优势正是解决这些痛点：

代码极简：用|串联组件，如prompt | model | parser；
原生支持流式：可直接返回迭代器，实现“逐字输出”；
标准化接口：所有组件均实现Runnable协议，输入输出均为字典，无缝衔接；
高级功能内置：支持调试、重试、并行调用（如同时调用两个模型对比结果）。

4.2 LCEL的核心语法

LCEL的核心是「管道符|」，规则如下：

左侧组件的输出 → 作为右侧组件的输入；
所有组件的输入/输出均为字典格式（键为变量名，值为数据）；
链的最终调用用invoke()（同步）、ainvoke()（异步）或stream()（流式）。

语法结构示例：

# 组件1：提示模板（输入：question；输出：格式化后的prompt）
prompt = ChatPromptTemplate.from_template("回答问题：{question}")

# 组件2：大模型（输入：格式化后的prompt；输出：模型原始响应）
model = ChatOpenAI(...)

# 组件3：输出解析器（输入：模型原始响应；输出：纯文本）
parser = StrOutputParser()

# 用|串联成链
chain = prompt | model | parser

# 调用链（输入字典需包含question变量）
result = chain.invoke({"question": "如何学习AI大模型？"})

4.3 LCEL完整实战案例（对比旧版LLMChain）

4.3.1 案例需求

实现“接收用户问题→生成格式化提示→调用模型→解析纯文本输出”的流程，对比LCEL与LLMChain的代码差异。

4.3.2 代码实现（LCEL版 vs LLMChain版）

# 导入依赖（LCEL需额外导入输出解析器）
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain.chains import LLMChain

# 初始化大模型（两版共用）
model = ChatOpenAI(
    model_name='deepseek-r1:7b',  # 本地模型名称，根据实际情况填写
    base_url="http://127.0.0.1:11434/v1",  # 本地模型API地址
    api_key="none",  # 本地模型通常不需要真实API密钥
    temperature=0.7  # 可根据需要调整温度参数
)

# --------------------------
# 方式1：新版LCEL实现（推荐）
# --------------------------
print("=== LCEL版输出 ===")
# 1. 定义提示模板（用ChatPromptTemplate，支持多轮对话格式）
lcel_prompt = ChatPromptTemplate.from_template(
    "你是AI学习顾问，请用3个步骤回答：{question}"
)

# 2. 定义输出解析器（将模型响应转为纯文本）
parser = StrOutputParser()

# 3. 用管道符串联组件（prompt → model → parser）
lcel_chain = lcel_prompt | model | parser

# 4. 调用链（输入为字典，key与模板变量一致）
lcel_result = lcel_chain.invoke({"question": "零基础如何学习AI大模型？"})
print(lcel_result)

# --------------------------
# 方式2：旧版LLMChain实现
# --------------------------
print("\n=== LLMChain版输出 ===")
# 1. 定义提示模板
llmchain_prompt = ChatPromptTemplate.from_template(
    "你是AI学习顾问，请用3个步骤回答：{question}"
)

# 2. 构建LLMChain（需显式传入llm和prompt）
llm_chain = LLMChain(
    llm=model,
    prompt=llmchain_prompt
)

# 3. 调用链（需传递字典参数）
llmchain_result = llm_chain.invoke({"question": "零基础如何学习AI大模型？"})
print(llmchain_result["text"])

4.3.3 运行结果对比

两者输出逻辑一致，但LCEL代码更简洁（少了显式的LLMChain封装）：

=== LCEL版输出 ===
<think>
嗯，我现在想开始学习人工智能大模型，但我对这个领域几乎一无所知。首先，我得弄清楚人工智能和大模型到底是什么。听说大模型像ChatGPT那样可以回答各种问题，这看起来很酷，但我不确定具体是怎么运作的。

接下来，我觉得基础知识是必须有的。数学方面，听说线性代数、微积分和概率统计很重要，但我对这些领域了解不多。我应该从哪里开始呢？可能需要找一些入门教程或者书籍来学习这些基础概念。然后编程基础也很重要，特别是Python，因为我知道它被广泛用于机器学习。如果我对编程不太熟悉，可能需要花时间学习数据结构、算法以及Python的基础语法。

接着是机器学习和深度学习的概念。我听说过监督学习、无监督学习和强化学习，但具体怎么操作还是模糊的。我还记得看到过一些模型，比如神经网络，但不清楚它们是如何训练起来的。可能需要找一个具体的项目来实践，逐步了解这些概念。另外，工具方面，像TensorFlow或PyTorch听起来很有用，但我不太清楚哪个更适合我，或者如何安装和使用它们。

然后是搭建自己的模型，这听起来有点复杂。听说可以通过开源库来实现，比如训练一个分类器，但实际操作起来可能需要处理大量数据和调参，这些我都不是很清楚该怎么开始。可能需要寻找一些教程或案例研究，一步步跟着走。

最后，关于AI的应用和伦理问题，我也感到好奇。我知道大模型被用来回答问题和生成内容，但它们在安全性和隐私方面可能会有问题。我得学习相关的伦理规范，确保我的使用符合道德标准，避免滥用这些技术。

总的来说，我需要系统地学习基础知识，逐步掌握编程技能，了解机器学习和深度学习的概念，并尝试实际操作来应用这些知识。同时，关注当前的研究和实践，保持对新知识的更新也是很重要的。
</think>

学习人工智能大模型可以从以下三个步骤开始：

1. **建立基础知识**：
   - 学习数学：从基础的代数、微积分和统计学入手，理解线性代数、微积分和概率论在AI中的应用。
   - 掌握编程：选择Python作为学习语言，掌握数据结构、算法和基础编程概念。可以通过在线课程或书籍逐步学习。

2. **了解机器学习与深度学习**：
   - 学习概念：研究监督学习、无监督学习和强化学习的基本原理，理解神经网络和深度学习的运作机制。
   - 实践操作：尝试构建一个简单的分类模型，使用TensorFlow或PyTorch进行数据处理和模型训练。

3. **实践与应用**：
   - 开发项目：利用开源库构建和训练模型，如训练一个分类器或生成式AI工具。
   - 关注前沿：追踪AI研究进展，了解大模型的最新发展和应用案例，确保理解和应用符合伦理规范。

=== LLMChain版输出 ===
D:\a-pythonProject\ai-langchain\main.py:355: LangChainDeprecationWarning: The class `LLMChain` was deprecated in LangChain 0.1.17 and will be removed in 1.0. Use :meth:`~RunnableSequence, e.g., `prompt | llm`` instead.
  llm_chain = LLMChain(
<think>
好，我现在需要回答用户的问题：“零基础如何学习AI大模型？”按照要求，我需要用三个步骤来详细解释。让我仔细思考一下应该如何组织这些建议。

首先，我想第一步应该是关于基础知识的学习。因为AI大模型建立在很多技术的基础之上，所以必须先打好这些基础。数学和编程是关键，特别是线性代数、概率统计等数学知识对理解机器学习算法很重要。编程语言方面，Python是最常用的，因为它有丰富的库和支持社区，所以需要掌握基础语法和常用库的使用。

接下来是实践操作，也就是搭建AI大模型的项目。只有实际动手做，才能真正理解和应用所学知识。可以选择一些开源框架，比如TensorFlow或PyTorch，从简单的分类任务开始，逐步尝试改进模型性能。通过自己的项目积累经验，同时参考优秀案例和教程，可以更快地提升技能。

最后是持续学习和优化阶段。AI领域发展迅速，需要不断更新知识和工具。了解最新的技术趋势，如大语言模型的发展、模型压缩等，并将这些新知识应用到实际项目中。定期回顾并优化自己的模型，保持模型性能的竞争力。

现在，我应该把这些思路整理成三个步骤，每一步下面加上详细说明，确保内容清晰易懂。
</think>

零基础学习AI大模型可以分为以下三个步骤：

1. **打好数学和编程基础**  
   - 学习线性代数、概率统计、微积分等数学知识。  
   - 掌握Python编程，了解数据结构、算法和库如NumPy、Pandas的使用。

2. **实践操作，搭建AI模型项目**  
   - 利用开源框架（如TensorFlow、PyTorch）开始小规模项目，如文本分类或图像识别。  
   - 参考教程和案例，逐步学习构建和优化模型。

3. **持续学习与优化模型**  
   - 关注新技术如大语言模型进展、模型压缩等。  
   - 不断优化模型性能，并将新知识应用到实际项目中，提升模型效果。

Process finished with exit code 0

5. 旧版Chain vs 新版LCEL核心差异

为了帮助大家快速选择，整理两者的关键差异如下表：

对比维度	旧版Chain（如LLMChain）	新版LCEL（LangChain 0.3+）
构建方式	类继承（需实例化Chain子类）	声明式管道（`
代码简洁度	繁琐（需显式封装Chain）	极简（一行串联多个组件）
流式响应	不支持	原生支持（stream()方法）
异步调用	需用arun()，接口不统一	原生支持（ainvoke()/astream()）
组件兼容性	仅支持Chain子类	支持所有实现Runnable协议的组件
高级功能	无（需手动实现重试、并行）	内置调试、重试、并行调用
适用场景	入门学习、简单单步任务	生产级应用、复杂多步骤流程

6. 总结

6.1 核心总结

Chain的本质：组件的有序串联，解决多步骤AI任务的流程化问题；
LLMChain定位：基础入门链，适合理解“模板+模型”的简单组合，已逐步被LCEL替代；
LCEL优势：LangChain 0.3+的推荐范式，用|简化组装，支持流式、异步，适合生产场景。

打赏

版权及免责申明：本文来源于#chandfy，由@人工智能研究所整理发布。如若内容造成侵权/违法违规/事实不符，请联系本站客服处理!该文章观点仅代表作者本人，不代表本站立场。本站不承担相关法律责任。

如若转载，请注明出处：https://www.aipuzi.cn/ai-tutorial/253.html

THE END

人工智能研究所

发现AI神器，探索AI技术！

+ 关注

零基础学AI大模型之LangChain链

文章目录

零基础学AI大模型之LangChain链

1. 引言：为什么需要「Chain」？

2. 核心概念：什么是Chain？

2.1 Chain的定义

2.2 用Java责任链模式类比理解

2.3 Chain的核心价值

3. 基础链实战：LLMChain

3.1 LLMChain的核心构成

3.2 LLMChain完整实战案例

3.2.1 环境准备

3.2.2 代码实现（含详细注释）

3.2.3 运行结果示例

3.3 LLMChain的适用场景

4. 新范式实战：LCEL（LangChain Expression Language）

4.1 为什么需要LCEL？

4.2 LCEL的核心语法

4.3 LCEL完整实战案例（对比旧版LLMChain）

4.3.1 案例需求

4.3.2 代码实现（LCEL版 vs LLMChain版）

4.3.3 运行结果对比

5. 旧版Chain vs 新版LCEL核心差异

6. 总结

6.1 核心总结

相关文章