DeerFlow:字节跳动开源超级智能体编排框架,支持多智能体协同与沙箱安全执行

原创 发布日期:
62

一、DeerFlow是什么

DeerFlow是由字节跳动研发并开源的社区驱动型超级智能体编排框架(Super Agent Harness)。项目最初定位为深度研究(Deep Research)框架,经过2.0版本完全重构后,升级为通用型智能体执行底座,不再局限于科研场景,可面向几乎所有需要多步骤、多工具、多智能体协同的自动化任务场景。

DeerFlow的核心定位是:为大模型智能体提供可运行、可编排、可扩展、可管控的标准化运行环境,让智能体不只“回答问题”,而是能够自主规划、联网检索、执行代码、读写文件、生成报告、协同作业,最终以结构化、可落地的形式交付成果。它把零散的LLM能力、工具能力、执行环境、记忆系统整合为一套开箱即用的体系,让普通用户无需编写复杂代码,即可使用超级智能体完成高价值工作;让开发者可以快速二次开发、扩展技能、接入私有工具,构建行业专属智能体应用。

DeerFlow 2.0与1.x版本无代码复用,是完全重写的新一代架构,核心遵循“源于开源,回馈开源”的理念,开放全部源码,支持本地部署、私有化部署、云端一键部署,兼容主流大模型与搜索引擎,数据可完全留存本地,兼顾能力、安全与可控性。

简单来说,DeerFlow不是一个单一的聊天机器人,而是一个带沙箱电脑、带文件系统、带长期记忆、带任务规划、带子智能体集群的AI工作平台,你可以把它理解为一个“24小时在线的全能研究助理+数据分析师+内容创作者+代码执行者”。

二、功能特色

DeerFlow 2.0提供完整的超级智能体能力,功能覆盖任务规划、工具调用、智能体调度、执行环境、内容生成、人机协作、持久记忆、可视化交互八大维度,核心特色如下。

1. 可扩展技能与工具系统(Skills & Tools)

DeerFlow采用技能化设计,把复杂能力封装为可复用、可插拔的技能模块,支持按需加载,不占用多余上下文。

  • 内置技能:深度研究、报告生成、幻灯片制作、网页生成、图片生成、播客生成等。

  • 自定义技能:用户可通过Markdown文件编写专属工作流,扩展行业技能、业务流程、合规检查等。

  • 工具生态:原生支持联网搜索、网页抓取、文件读写、Bash执行、Python代码运行、私有知识库对接;通过MCP(Model Context Protocol)协议可无缝接入第三方工具、内部系统、知识图谱、数据库等。

2. 动态子智能体编排(Sub-Agents)

面对复杂任务时,DeerFlow不会单智能体硬扛,而是动态派生子智能体并行处理,提升效率与可靠性。

  • 主智能体负责统筹规划、结果汇总;

  • 子智能体各司其职,例如研究员负责搜索、编码员负责运行代码、报告员负责整理输出;

  • 支持并行执行、超时控制、结果回收、异常重试,适合长时间、大规模、多分支的复杂任务。

3. 隔离沙箱与独立文件系统(Sandbox & File System)

这是DeerFlow区别于普通智能体的核心安全能力,让智能体在受控环境中操作,不影响主机。

  • 每个任务独立运行在隔离沙箱中,支持本地模式、Docker容器模式、K8s模式;

  • 提供完整文件系统:上传区、工作区、输出区,智能体可自由读写、编辑、查看文件;

  • 所有操作可审计、可回溯、跨任务不污染,支持代码执行、数据处理、文档生成等高风险操作。

4. 上下文工程(Context Engineering)

为了解决长任务、多步骤导致的上下文溢出问题,DeerFlow内置轻量化上下文管理机制。

  • 子智能体上下文隔离,互不干扰;

  • 自动摘要:完成子任务后自动压缩历史信息;

  • 文件卸载:把中间结果存入文件,减少Prompt占用;

  • 保持长时间任务稳定运行,不卡顿、不丢失信息。

5. 跨会话持久记忆(Long-Term Memory)

DeerFlow具备用户级长期记忆,跨对话、跨时间保留信息。

  • 自动提取用户偏好、写作风格、常用设置、业务习惯;

  • 记忆本地存储,完全可控;

  • 使用越久越贴合用户习惯,减少重复指令。

6. 人在回路(Human-in-the-Loop)

支持用户全程介入智能体执行流程,保证结果合规、方向正确。

  • 任务规划阶段:自动生成执行计划,用户可直接通过自然语言编辑、驳回、通过;

  • 执行阶段:可随时干预、补充信息、调整方向;

  • 输出阶段:支持类Notion块编辑,AI润色、缩写、扩写。

7. 多形态内容生成

一次研究,多格式输出:

  • 结构化研究报告;

  • PPT幻灯片自动生成;

  • 播客脚本+语音合成(TTS);

  • 图表、文档、网页等。

8. 开箱即用Web UI

提供完整前端界面,非技术用户也可直接使用:

  • 可视化任务流程;

  • 实时查看执行步骤;

  • 在线编辑报告;

  • 文件上传下载;

  • 多轮对话管理。

9. 模型无关与多数据源兼容

  • 支持任何兼容OpenAI接口的大模型,包括闭源模型与开源本地模型;

  • 支持多种搜索引擎:Tavily、Brave、DuckDuckGo、Arxiv;

  • 支持对接RAGFlow等私有知识库,处理内部文档。

10. 全环境部署支持

  • Docker一键部署(推荐);

  • 本地原生部署;

  • 支持云端FaaS托管;

  • 支持Linux/macOS/Windows。

核心功能对比表

能力维度 普通LLM对话 普通智能体框架 DeerFlow 2.0
任务规划 简单规划 动态多步规划+人在回路
执行环境 受限调用 独立沙箱+完整文件系统
智能体调度 单智能体 主子智能体协同并行
长期记忆 会话级 跨会话持久用户记忆
内容产出 纯文本 文本/简表 报告/PPT/播客/网页
部署方式 云端服务 复杂部署 一键Docker/本地/云端
数据安全 数据上云 有限可控 本地私有化+隔离沙箱

三、技术细节

DeerFlow 2.0采用现代化、模块化、生产级的技术栈,架构清晰、易于维护、易于扩展。

1. 整体技术架构

  • 底层依赖:LangGraph + LangChain

  • 后端:Python 3.12+,FastAPI

  • 前端:Next.js + TypeScript

  • 中间层:Nginx反向代理,统一入口

  • 执行环境:沙箱系统(本地/Docker/K8s)

  • 存储:内存/PostgreSQL/MongoDB(持久化检查点)

  • 协议:MCP(Model Context Protocol)

2. 后端服务结构

  • LangGraph Server(端口2024):智能体编排、任务流执行

  • Gateway API(端口8001):模型管理、MCP、技能、文件上传、记忆管理

  • Nginx(端口2026):统一入口,路由转发,提供Web访问

  • Web前端(端口3000):可视化界面

3. 智能体核心组件

  • Lead Agent:主智能体,入口调度

  • Middleware:9大中间件,负责线程数据、上传文件、沙箱、摘要、任务清单、标题生成、记忆、图片查看、澄清请求

  • Subagent System:子智能体并发执行,默认最大并行3个

  • Sandbox System:抽象沙箱接口,支持多提供商

  • Memory System:本地JSON持久化记忆

  • Tool System:沙箱工具、内置工具、社区工具、MCP扩展工具

4. 沙箱运行模式

DeerFlow提供三种沙箱模式,可在config.yaml中切换:

  1. Local Execution:直接在主机运行(适合本地测试)

  2. Docker Execution:Docker隔离容器(推荐,安全稳定)

  3. Kubernetes Execution:K8s Pod隔离(企业级高安全)

5. 技能扩展规范

技能以SKILL.md文件存放,结构固定:

  • 路径:/mnt/skills/public 或 /mnt/skills/custom

  • 格式:Markdown,包含工作流说明、最佳实践、资源引用

  • 加载:按需加载,不占用上下文

6. 配置文件体系

  • config.yaml:主配置(模型、沙箱、工具、技能)

  • .env:环境变量(API密钥、搜索引擎密钥、TTS密钥)

  • extensions_config.json:MCP服务与技能开关

7. 开发与构建体系

  • uv:Python环境与依赖管理

  • pnpm:前端依赖

  • Makefile:统一命令(make dev/make docker-start/make lint)

  • 热重载:开发环境修改代码自动重启服务

DeerFlow:字节跳动开源超级智能体编排框架,支持多智能体协同与沙箱安全执行

四、应用场景

DeerFlow 2.0已经突破最初的研究框架定位,成为通用超级智能体平台,可广泛应用于个人、学术、企业、内容生产等场景。

1. 深度学术研究

  • 自动调研前沿技术、论文、行业趋势;

  • 多源信息交叉验证,生成综述报告;

  • 处理文献、数据、图表,自动整理成论文草稿;

  • 适合学生、研究员、高校教师。

2. 行业与商业分析

  • 自动抓取市场数据、竞品信息、政策法规;

  • 生成行业报告、竞品分析、投资研究;

  • 支持批量处理、定期更新。

3. 内容创作自动化

  • 生成长文、报告、白皮书、公众号文章;

  • 自动生成PPT、播客;

  • 适合自媒体、营销、新媒体运营。

4. 数据分析与代码执行

  • 上传数据文件,自动分析、清洗、可视化;

  • 智能体编写并运行Python代码验证结论;

  • 适合数据分析师、业务人员。

5. 企业私有知识问答

  • 对接内部文档库,智能体在私有数据范围内检索、总结;

  • 数据不出内网,满足合规要求;

  • 适合法务、HR、行政、客服知识库。

6. 教育与学习辅助

  • 自动整理知识点、生成习题、解答疑问;

  • 辅助写作、翻译、润色;

  • 提供交互式学习体验。

7. 日常办公自动化

  • 会议纪要整理、信息汇总、报表生成;

  • 多文档合并、对比、提取要点;

  • 提高白领办公效率。

8. 开发者与二次开发

  • 快速构建行业智能体应用;

  • 扩展MCP工具、自定义技能、对接内部系统;

  • 作为AI产品的底层编排引擎。

五、使用方法

DeerFlow提供Docker一键部署本地原生部署两种方式,官方推荐Docker。

1. 环境准备

  • Docker Desktop(推荐)

  • 或:Python 3.12+、Node.js 22+、pnpm、uv、nginx

2. Docker快速部署(最简单)

# 克隆仓库
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

# 初始化(仅第一次)
make docker-init

# 启动服务
make docker-start

# 访问Web UI
http://localhost:2026

3. 本地开发部署

# 检查依赖
make check

# 安装依赖
make install

# 启动全部服务(前端+后端+代理)
make dev

# 访问
http://localhost:2026

4. 配置步骤

  1. 复制配置模板

cp config.example.yaml config.yaml
cp .env.example .env
  1. 在.env中填入LLM密钥、搜索引擎API Key

  2. 在config.yaml中选择沙箱模式

  3. 重启服务生效

5. 基本使用流程

  1. 打开Web UI

  2. 输入研究任务或问题

  3. 智能体生成执行计划

  4. 用户审核/编辑计划(人在回路)

  5. 智能体调度子智能体执行

  6. 实时查看搜索、爬取、代码执行过程

  7. 自动生成报告

  8. 在线编辑、导出、生成PPT/播客

6. 交互模式(命令行)

uv run main.py --interactive

支持中英文,可选择内置问题或自定义问题,快速生成报告。

六、常见问题解答(FAQ)

DeerFlow 2.0和1.x有什么区别?

DeerFlow 2.0是完全重写的版本,和1.x没有代码共用。1.x定位是深度研究框架,2.0升级为超级智能体编排底座,能力更强、架构更稳定、用途更广泛,目前官方主力开发2.0。

DeerFlow必须联网使用吗?

核心研究能力需要联网获取信息,但纯本地任务(如本地文件分析、代码执行、私有知识库问答)可在内网/本地环境运行,数据不上云。

使用DeerFlow会把数据上传到第三方平台吗?

不会。DeerFlow是开源本地部署项目,所有数据、对话、文件、记忆都存储在你自己的机器上,API密钥仅用于调用模型和搜索引擎,不会上传给字节跳动或其他第三方。

我没有GPU可以运行DeerFlow吗?

可以。DeerFlow默认调用云端大模型(如OpenAI、DeepSeek、通义千问、文心一言等兼容OpenAI接口的模型),无需本地推理,普通电脑即可流畅运行。

支持哪些大模型?

支持所有提供OpenAI兼容接口的模型,包括闭源商业模型和本地部署的开源模型(如Llama 3、Qwen、GLM等),只需在config.yaml中配置地址和密钥即可。

支持哪些搜索引擎?

默认支持Tavily、Brave Search、DuckDuckGo、Arxiv,可在.env中切换,部分不需要API Key,开箱即用。

沙箱执行代码安全吗?

安全。Docker/K8s沙箱模式完全隔离环境,任务结束后销毁容器,无法访问主机文件、系统权限,可安全执行Python、Bash等操作。

如何添加自定义工具?

可通过MCP协议接入第三方工具,也可在源码中扩展Python工具,或编写自定义技能(SKILL.md),无需修改核心代码。

报告生成后可以编辑吗?

可以。Web UI内置类Notion块编辑器,支持手动修改、AI润色、缩写、扩写、格式化。

可以对接企业内部知识库吗?

可以。原生支持对接RAGFlow等私有RAG引擎,可上传PDF/Word/PPT/Excel等文档,智能体基于内部文档回答问题,不泄露数据。

Windows系统可以运行吗?

可以。支持Docker部署与原生部署,官方提供bootstrap.bat启动脚本,Windows 10/11均可使用。

DeerFlow是免费的吗?可以商用吗?

DeerFlow采用MIT开源协议,完全免费,可商用、可二次开发、可修改分发,只需保留原版权声明。

如何保存历史对话和报告?

系统自动保存对话历史、执行检查点、生成的文件,支持重新打开、继续编辑、重新执行。

运行速度慢怎么办?

可降低最大规划步数、减少子智能体数量、选择更快的模型与搜索引擎、使用Docker沙箱提升稳定性。

如何参与项目贡献?

可提交Issue、PR,改进文档、修复bug、新增技能、优化前端,官方提供详细贡献指南(CONTRIBUTING.md)。

七、相关链接

八、总结

DeerFlow是字节跳动推出的开源超级智能体编排框架,历经版本迭代后从深度研究工具升级为通用型智能体运行平台,基于LangGraph构建,集成子智能体调度、隔离沙箱、文件系统、持久记忆、人在回路、多格式输出等核心能力,提供开箱即用的Web UI与完善的开发体系,支持本地私有化部署,数据安全可控,可广泛应用于学术研究、商业分析、内容创作、数据分析、企业知识库、办公自动化等场景,既满足普通用户零代码使用超级智能体的需求,也为开发者提供高度可扩展的二次开发底座,是当前开源社区中功能完整、架构现代化、生产可用的AI智能体系统。

打赏
THE END
作者头像
AI铺子
关注ai行业发展,专注ai工具推荐