LangChain 是什么？零基础也能懂的 AI 工具框架入门（附类比说明）

原创发布日期：2026-04-10

146

在人工智能大模型（LLM）爆发的时代，ChatGPT、GPT-4、Claude 等模型展现了惊人的语言理解与生成能力。然而，对于广大开发者而言，如何将这些“云端大脑”落地到具体的业务场景中，依然是一座难以逾越的高山。模型接口不统一、上下文难以管理、外部工具无法调用、数据隐私难以保障……这些痛点让许多AI应用停留在“Demo”阶段。

此时，LangChain 应运而生。它不是一个模型，而是一套强大的应用开发框架，被誉为连接大模型与现实世界的“超级胶水”。本文将从零开始，用最通俗易懂的方式，带你深入了解这个大模型开发必备框架，即使你是AI领域的“小白”，也能快速上手，构建属于自己的智能应用。

一、为什么我们需要 LangChain？

在 LangChain 出现之前，开发一个 LLM 应用意味着你需要从零开始处理大量繁琐的底层逻辑：

接口碎片化：OpenAI、Anthropic、Hugging Face、百度千帆等厂商的 API 规范各不相同，切换模型需要重构大量代码。
上下文割裂：LLM 本身是“无状态”的，每次调用都是全新的开始。要实现多轮对话，开发者必须自己维护复杂的历史记录。
能力孤岛：模型只能生成文本，无法直接查询数据库、发送邮件或执行代码。要让模型具备这些能力，需要编写大量的“胶水代码”。
幻觉问题：模型经常一本正经地胡说八道。如果没有外部知识库的支持，它无法回答企业内部数据或最新资讯。

LangChain 的核心价值就在于解决上述所有问题。它通过模块化设计，为开发者提供了一套标准化的工具集，让开发者可以像搭积木一样，快速拼装出功能强大的 LLM 应用。无论是简单的单轮问答，还是复杂的多智能体协作系统，LangChain 都能大幅降低开发门槛，让你专注于业务逻辑，而非底层 plumbing。

核心观点：LangChain 不生产大模型，它是大模型的“操作系统”和“连接器”，负责调度模型、管理数据、连接工具，让 LLM 真正成为生产力工具。

二、 LangChain 的核心架构与六大模块

LangChain 的设计哲学是“组件化”与“可组合性”。整个框架由多个独立的模块组成，你可以根据需求自由选用。以下是 LangChain 最核心的六大模块，也是你必须掌握的基础知识。

1. Model I/O（模型输入输出）：统一的接口层

这是 LangChain 与大模型交互的“大门”。它最伟大的设计在于抽象。

统一接口：无论你使用的是 OpenAI 的 GPT-4、Anthropic 的 Claude 3，还是开源的 Llama 3、DeepSeek，甚至是本地部署的 Ollama 模型，在 LangChain 中都通过统一的 LLM 或 ChatModel 接口调用。你只需修改一行配置，就能在不同模型间无缝切换。
提示词模板（Prompt Templates）：不要再手动拼接字符串！LangChain 提供了强大的模板引擎，支持动态变量注入。你可以定义 SystemMessagePromptTemplate、HumanMessagePromptTemplate 等，将用户输入、历史对话、外部数据自动填充到提示词中，既规范又高效。
输出解析器（Output Parsers）：模型输出的通常是纯文本，但程序需要的是结构化数据（如 JSON、List）。Output Parsers 可以强制模型按指定格式输出，并自动将其转换为代码对象，极大提升了后续处理的效率。

2. Data Connection（数据连接）：让模型“读”懂你的数据

大模型的通用知识是有限的，要让它回答特定问题，必须引入私有数据。LangChain 提供了完整的数据处理流水线，即 RAG（检索增强生成） 的标准实现。

其核心流程遵循 LEDVR 工作流：

L (Loader)：文档加载器。支持读取 PDF、Word、CSV、网页、数据库等多种数据源。
E (Embedding)：嵌入模型。将文本转换为高维向量，捕捉语义信息。
D (Document Transformers)：文档转换器。最常见的是文本分割器（Text Splitters），将长文档切分成适合模型处理的小块（Chunk）。
V (Vector Store)：向量存储。将向量存入专门的数据库（如 Pinecone、Chroma、FAISS），实现高效的语义检索。
R (Retriever)：检索器。根据用户问题，从向量库中找回最相关的文档片段，作为生成答案的“参考资料”。

3. Chains（链）：串联逻辑的“流水线”

“链”是 LangChain 的灵魂。它将多个组件（如模型、提示词、工具、输出解析器）按顺序连接起来，形成一个完整的工作流。

例如，一个典型的客服机器人链可能包含以下步骤：

接收用户问题。
检索知识库相关文档。
将问题+文档拼接成新的 Prompt。
调用 LLM 生成回答。
将回答存入数据库。

LangChain 提供了多种预制链，如 LLMChain（最基础的链）、ConversationChain（带记忆的对话链）、RouterChain（根据问题自动选择处理路径）等。你也可以自定义链，实现任意复杂的业务逻辑。

4. Memory（记忆）：赋予对话“灵魂”

LLM 本质上是无记忆的。如果你问“它是谁？”，模型会一脸茫然，因为它不知道“它”指代上一句提到的“张三”。

LangChain 的 Memory 模块解决了这个问题。它能自动保存对话历史，并在每次调用时将相关历史注入到 Prompt 中。

ConversationBufferMemory：最常用的记忆类型，简单粗暴地保存所有历史对话。
ConversationSummaryMemory：对历史对话进行摘要，只保留核心信息，节省 Token。
ConversationSummaryBufferMemory：结合了前两者，既保留近期详细对话，又对远期对话进行摘要，平衡了效果与成本。

5. Agents（智能代理）：赋予模型“行动”的能力

如果说 Chain 是固定的流水线，那么 Agent 就是拥有自主决策能力的“大脑”。

Agent 的核心思想是：将 LLM 作为推理引擎，让它自己决定下一步做什么。

当用户提出一个复杂需求（如“帮我查一下上海明天的天气，并推荐一家适合室内活动的餐厅”），Agent 会：

思考：分析任务，拆解为“查天气”和“搜餐厅”两个子任务。
规划：决定先调用“天气查询工具”，再调用“搜索引擎工具”。
行动：调用相应的 Tool（工具），获取结果。
观察：读取工具返回的数据。
总结：将工具结果整合，生成最终答案给用户。

LangChain 内置了多种 Agent 类型（如 create_tool_calling_agent、create_react_agent），并支持自定义工具。

6. Callbacks（回调）：可观测性的“黑匣子”

在生产环境中，你需要知道模型每一步在做什么：花了多少时间？消耗了多少 Token？输入输出是什么？

LangChain 的回调系统允许你在应用运行的各个阶段（如开始、结束、出错）插入自定义逻辑。这对于日志记录、性能监控、成本统计至关重要。配合 LangSmith 平台，你甚至可以可视化地看到每一条链的执行轨迹，快速定位问题。

LangChain 是什么？零基础也能懂的 AI 工具框架入门（附类比说明）

三、快速上手：小白的第一个 LangChain 应用

理论讲了这么多，不如动手实战。下面我们用 Python 构建一个最简单的“旅游助手”聊天机器人。

1. 环境准备

首先，安装必要的库。建议使用 Python 3.11 或 3.12 版本。

pip install langchain langchain-openai python-dotenv

为了安全，不要把 API Key 写死在代码里。在项目根目录创建 .env 文件：

OPENAI_API_KEY="sk-xxxxxxxxxxxxxxxx"

2. 编写代码

创建一个 main.py 文件，输入以下代码：

import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI
from langchain.prompts.chat import ChatPromptTemplate, SystemMessagePromptTemplate, HumanMessagePromptTemplate
from langchain.chains import LLMChain

# 1. 加载环境变量
load_dotenv()

# 2. 初始化模型 (这里使用 OpenAI 的 gpt-3.5-turbo 为例)
llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0.7)

# 3. 创建提示词模板
system_template = "你是一个专业的旅游顾问，擅长根据用户的需求推荐景点和美食。"
human_template = "用户想去 {city} 旅游，预算大概是 {budget} 元，请给出一份简短的行程建议。"

system_msg = SystemMessagePromptTemplate.from_template(system_template)
human_msg = HumanMessagePromptTemplate.from_template(human_template)

chat_prompt = ChatPromptTemplate.from_messages([system_msg, human_msg])

# 4. 创建链 (Chain)
chain = LLMChain(llm=llm, prompt=chat_prompt)

# 5. 运行并输出结果
res = chain.invoke({
  "city": "成都",
  "budget": 3000
})

print("=== AI 旅游助手 ===")
print(res['text'])

3. 代码解析

Model I/O：我们使用了 ChatOpenAI 封装了 OpenAI 的接口。
Prompt Template：我们定义了系统角色（旅游顾问）和用户输入的变量（城市、预算）。
Chain：LLMChain 将模型和提示词绑定在一起，形成了一个最简单的执行单元。
Invoke：这是 LangChain 统一的调用入口，传入参数即可运行。

运行这段代码，你就能看到模型根据你的输入生成了一段像样的成都旅游建议。这只是冰山一角，但足以让你感受到 LangChain 的威力。

四、进阶实战：LangChain 的三大核心场景

掌握了基础，我们来看看 LangChain 在真实世界中是如何大显身手的。

场景一：企业知识库问答（RAG）

痛点：公司内部有几百份 PDF 规章制度，员工查一个“报销流程”要翻半天。
LangChain 解决方案：

加载：使用 PyPDFLoader 读取所有 PDF。
分割：用 RecursiveCharacterTextSplitter 将文本切成小块。
向量化：调用 OpenAI Embedding 模型转为向量，存入 ChromaDB。
检索：用户提问时，先在 ChromaDB 中做语义搜索（Semantic Search），找到最相关的 3 个片段。
生成：将这 3 个片段作为“背景知识”塞给 LLM，让它基于这些知识回答。

优势：告别关键词匹配的死板搜索。即使文档里写的是“财务报销规范”，用户搜“怎么报账”，LangChain 也能通过语义理解找到正确答案，并有效抑制模型的幻觉。

场景二：自动化工作流与智能客服

痛点：电商客服每天重复回答“发货了吗”、“退货政策是什么”，且需要查询订单系统。
LangChain 解决方案：

Agent + Tools：构建一个客服 Agent，给它配备工具：

SearchTool：搜索公开的商品手册。
DatabaseTool：连接 SQL 数据库查询订单状态。
PythonREPL：计算优惠金额。

Memory：使用 ConversationBufferMemory 记住用户之前的对话（比如用户刚才问了A商品，现在问“它的尺寸”，Agent 知道“它”指 A）。
Routing：对于简单的打招呼，直接用预设模板回复；对于复杂查询，自动路由给 Agent 处理。

优势：7x24小时在线，且能调用API完成实际操作，不仅仅是聊天。

场景三：代码生成与数据分析

痛点：非技术人员想分析销售数据，但不会写 SQL 或 Python。
LangChain 解决方案：

DataFrame Tool：将 Excel/CSV 数据加载为 Pandas DataFrame，并封装成工具给 LLM。
Code Interpreter：利用 LangChain 的代码执行能力，让 LLM 生成 Python 代码（如 Matplotlib 绘图、Pandas 统计），并在沙箱中运行。
Output：将生成的图表和分析报告直接返回给用户。

优势：让数据分析门槛降为零。用户只需用自然语言说“画个上个月销量的柱状图”，系统自动完成代码编写、执行、出图。

五、高级特性：工具、标签与可观测性

当你的应用变得复杂，以下特性将决定你的开发体验。

1. 自定义工具（Tools）与 `@tool` 装饰器

LangChain 允许你将任何 Python 函数变成 LLM 可调用的工具。最简单的方式是使用 @tool 装饰器：

from langchain_core.tools import tool

@tool
def multiply(a: int, b: int) -> int:
  """将两个数字相乘。这是工具的描述，LLM 会根据这个描述决定是否调用它。"""
  return a * b

LLM 会读取函数的 docstring 作为工具说明。当用户问“3乘以5等于多少”时，Agent 会自动识别并调用这个工具，而不是自己去算（因为大模型算术很差）。

进阶技巧：

InjectedToolArg：有些参数（如 user_id）不需要模型生成，而是从运行时环境注入，可以用此注解隐藏参数。
Toolkits：将一组相关的工具打包成一个 Toolkit，方便管理。

2. 结构化输出与 Pydantic

有时候你需要模型输出严格的 JSON 格式（如提取实体）。LangChain 支持 Pydantic 模型绑定：

from pydantic import BaseModel, Field
from langchain_core.utils.openai_functions import convert_pydantic_to_openai_function

class Person(BaseModel):
  name: str = Field(description="人名")
  age: int = Field(description="年龄")

# 转换为 OpenAI Function 格式
tools = [convert_pydantic_to_openai_function(Person)]

将这个工具绑定给模型，模型就会自动按 JSON Schema 输出，无需你在 Prompt 里苦苦哀求。

3. 标签（Tags）与追踪监控

在复杂的链中，如何区分哪一步消耗了最多时间？LangChain 的 Tags 系统可以帮你。

定义：Tags 是字符串列表，用于标记 Runnable 的执行步骤。
继承：Tags 会自动传递给所有子组件。
过滤：在回调处理器（CallbackHandler）中，你可以根据 Tags 过滤日志，只看特定模块的运行情况。

例如，你可以给数据库查询步骤打上 "db_query" 标签，给 LLM 调用打上 "llm_call" 标签。在 LangSmith 中，你可以清晰地看到每一类操作的耗时分布，快速定位性能瓶颈。

六、 LangChain 的生态与部署

LangChain 不仅仅是一个库，它已经形成了一个庞大的生态系统。

组件/工具	作用	适用场景
LangChain	核心Python库	开发逻辑、原型验证
LangGraph	多智能体编排	构建循环、状态化的复杂Agent（如客服+工单系统）
LangServe	模型服务化部署	将Chain封装为REST API，供生产环境调用
LangSmith	调试与监控平台	可视化追踪、测试集评估、生产监控
LangChain CLI	命令行工具	快速创建项目模板、本地调试

部署建议：

开发阶段：使用 Python 脚本 + .env 文件，配合 LangSmith 进行可视化调试。
生产阶段：使用 LangServe 或 Docker 容器化部署。LangServe 能自动处理并发、序列化、API密钥管理，是官方推荐的生产级方案。

七、总结：为什么 LangChain 是大模型开发的“必修课”？

回顾全文，我们可以清晰地看到 LangChain 的定位：它不是要替代大模型，而是要释放大模型的潜力。

对于初学者：它屏蔽了复杂的 API 差异和底层逻辑，让你用几十行代码就能跑通一个 Demo，建立信心。
对于工程师：它提供了生产级的抽象（Memory、Agent、Callbacks），解决了上下文管理、工具调用、可观测性三大难题。
对于企业：它是连接私有数据与公有大模型的桥梁，通过 RAG 技术保障了数据安全与准确性，是企业 AI 落地的最佳实践路径。

在这个“模型即服务”的时代，谁能最快地将模型能力与业务场景结合，谁就能掌握主动权。LangChain 正是那个帮你缩短“想法”到“产品”距离的利器。

不要被它庞大的组件库吓倒，正如所有的编程框架一样，从“Hello World”开始，逐步掌握 Model I/O、Chains、Memory、Agents 这四大金刚，你就已经超越了 80% 的 AI 开发者。现在，打开你的编辑器，安装 langchain，开始构建你的第一个智能应用吧！

打赏

版权及免责申明：本文由@AI工具箱原创发布。该文章观点仅代表作者本人，不代表本站立场。本站不承担任何相关法律责任。

如若转载，请注明出处：https://www.aipuzi.cn/ai-tutorial/what-is-langchain.html

THE END

AI工具箱

一个喜欢收集AI工具的小萌新

+ 关注

LangChain 是什么？零基础也能懂的 AI 工具框架入门（附类比说明）

文章目录

一、 为什么我们需要 LangChain？

二、 LangChain 的核心架构与六大模块

1. Model I/O（模型输入输出）：统一的接口层

2. Data Connection（数据连接）：让模型“读”懂你的数据

3. Chains（链）：串联逻辑的“流水线”

4. Memory（记忆）：赋予对话“灵魂”

5. Agents（智能代理）：赋予模型“行动”的能力

6. Callbacks（回调）：可观测性的“黑匣子”

三、 快速上手：小白的第一个 LangChain 应用

1. 环境准备

2. 编写代码

3. 代码解析

四、 进阶实战：LangChain 的三大核心场景

场景一：企业知识库问答（RAG）

场景二：自动化工作流与智能客服

场景三：代码生成与数据分析

五、 高级特性：工具、标签与可观测性

1. 自定义工具（Tools）与 @tool 装饰器

2. 结构化输出与 Pydantic

3. 标签（Tags）与追踪监控

六、 LangChain 的生态与部署

七、 总结：为什么 LangChain 是大模型开发的“必修课”？

相关文章

一、为什么我们需要 LangChain？

三、快速上手：小白的第一个 LangChain 应用

四、进阶实战：LangChain 的三大核心场景

五、高级特性：工具、标签与可观测性

1. 自定义工具（Tools）与 `@tool` 装饰器

七、总结：为什么 LangChain 是大模型开发的“必修课”？