Open Source AI Agent Framework

DeerFlow

字节跳动开源的深度研究Agent系统,基于LangGraph构建,支持多工具编排、 长期记忆与自动化工作流,为AI研究提供生产级解决方案。

LangGraph Multi-Agent Memory System Tool Orchestration Self-Improving
Stars 28.6K
Forks 3.2K
版本 2.4.6
语言 Python
提交 3,200+
01

执行摘要

DeerFlow 是字节跳动(ByteDance)于2025年11月开源的深度研究型AI Agent框架。 项目以 bytedance/deer-flow 为核心,通过 LangGraph 实现复杂工作流的 有向图编排,将大型语言模型(LLM)的推理能力与外部工具系统深度融合。

截至2026年4月,项目已积累 28.6K Stars3,200+ Commits81个版本迭代,成为AIAgent开源领域最受关注的明星项目之一。 其设计理念强调「人类在环(Human-in-the-Loop)」—— 在AI自主执行与人类监督之间建立精妙的平衡机制。

架构模式
LangGraph
有向图工作流编排
记忆系统
分层
短期 · 长期 · 语义三重记忆
心跳机制
Active
实时状态上报与监控
自改进
Beta
Agent自优化工作流
02

技术架构

Gateway Layer
REST API + FastAPI
提供标准化HTTP接口,支持会话管理、任务提交与结果查询。统一入口简化集成复杂度。
FastAPIUvicornCORS
Orchestration
LangGraph Engine
有向无环图(DAG)驱动的Agent编排引擎,支持条件分支、并行执行与状态持久化。
LangGraphStateGraphDAG
Agent Core
Research Agent
核心推理Agent,负责任务规划、工具调用决策与结果整合。采用ReAct范式。
ReActTool UsePlanning
Memory System
Triple-Layer Memory
短期会话记忆 → 长期向量存储 → 语义知识图谱,三层递进式记忆架构。
RedisVector DBKG
Tool System
Sandboxed Executor
隔离沙箱环境执行代码、搜索等敏感操作,内置Bash/Python/Docker多运行时。
SandboxBashDocker
Human-in-the-Loop
Approval + Revision
关键节点暂停等待人工确认,支持计划审查、结果修订与进度实时追踪。
ApprovalWebSocketReview
03

记忆系统

短期记忆
Session Context

基于 Redis 的会话上下文管理,维护当前对话轮次的完整状态。 包括用户输入历史、Agent中间推理结果、工具调用记录。 随会话结束自动清理,生命周期精确可控。

长期记忆
Vector Store

Chroma/Qdrant 等向量数据库存储历史研究片段,支持语义相似度检索。 跨会话积累知识片段,自动关联相关历史研究。 支持增量更新与定期向量化索引重建。

语义记忆
Knowledge Graph

结构化知识图谱记录实体关系(公司、人、技术、事件)。 支持复杂推理路径,增强跨文档关联分析能力。 可与向量记忆互补,提供精确关系查询。

记忆流转机制

用户输入 → 短期记忆(Redis)实时上下文 → LLM推理生成计划 → 工具执行 → 结果写入向量库 → 定期抽取实体关系同步至知识图谱 → 长期记忆复用

Input Short-term Inference Vector KG Sync
04

心跳与自动化

心跳上报机制

Agent执行过程中定时向服务端发送心跳,包含:当前节点状态、已完成步骤数、预估剩余时间、Token消耗统计。

服务端可据此实现实时进度追踪、异常检测与动态资源调配。

上报频率 每30秒
协议 WebSocket / HTTP
超时阈值 120秒
超时策略 自动重试 + 告警
自动化编排

基于 LangGraph 的 DAG 定义,支持条件分支、循环与并行子图。

内置定时触发、Webhook回调、事件驱动三种自动化模式,实现无人值守的批量研究任务。

Cron Trigger Webhook Event Bus Batch Mode
Active Paused Scheduled
05

工具系统

Web Search
信息检索

集成 Tavily、DuckDuckGo、Baidu 等多个搜索引擎,支持去重合并与结果质量评分。

TavilyDuckDuckGoSerpAPI
Code Executor
代码执行

隔离沙箱中执行 Python/Bash 代码,结果实时捕获返回,支持数据可视化渲染。

PythonBashDocker
Document Reader
文档解析

支持 PDF、Markdown、HTML、TXT 等多格式文档内容提取,自动识别元数据与章节结构。

PDFMarkdownHTML
Web Fetcher
网页抓取

通用网页内容抓取,支持动态渲染页面(JavaScript),自动处理反爬机制与速率限制。

PlaywrightSeleniumStatic
Image Analysis
图像理解

多模态模型支持图表、截图、信息图等视觉内容的深度理解与描述生成。

GPT-4VClaude-VGemini
Custom Tools
自定义工具

开放工具注册接口,支持企业自建API集成、知识库查询、业务系统对接等定制需求。

Plugin APIRESTgRPC
06

自改进系统

EXPERIMENTAL 该功能为实验性阶段,API 可能发生变化

DeerFlow 的自改进系统允许 Agent 在运行过程中自动识别自身不足, 通过反馈循环持续优化工具调用策略、Prompt 模板与执行路径。 系统会记录每次失败的推理尝试,并在后续任务中避免重复错误。

工作流程
  1. 执行 — Agent 完成任务推理与工具调用
  2. 评估 — 对输出质量进行多维度评分
  3. 反思 — 识别失败模式与改进方向
  4. 更新 — 修改 Prompt/策略并存入长期记忆
  5. 验证 — 在新任务中验证改进效果
改进维度
工具选择 优化中
Prompt 模板 优化中
执行路径 待实现
错误恢复 待实现
07

AI 模型支持

模型 支持角色 多模态 工具调用 状态
Claude (Anthropic) Researcher / Coder / Planner ✓ Vision ✓ 原生支持 推荐
GPT-4o / GPT-4.5 (OpenAI) Researcher / Coder ✓ 原生 ✓ 函数调用 推荐
Gemini (Google) Researcher / Coder ✓ 原生 ✓ 函数调用 Beta
DeepSeek Researcher Beta
Qwen (阿里通义) Researcher ✓ Vision Beta
GLM / Zhipu Researcher Beta
模型选择建议
追求深度研究质量

优先选择 Claude 3.7 Sonnet / Claude 3.5 Sonnet,其长上下文窗口与推理能力最适合复杂研究任务。

平衡成本与性能

GPT-4o 提供良好的性价比,支持函数调用与多模态,适合日常研究与文档分析场景。

08

创始人故事

晚黎 / Wanli
字节跳动 · AI研究员 · DeerFlow 核心作者

DeerFlow 的核心作者「晚黎」是字节跳动的前 AI 研究员,以在社交媒体上活跃分享 AI 技术见解而闻名。 他于 2025 年 11 月 25 日正式发布 DeerFlow v0.1.1,并在随后数月内以极高频率迭代推进项目。

晚黎的公开分享风格直接、真诚,多次在 X/Twitter 上承认 DeerFlow 与 Manus 的设计相似性, 并明确表示项目定位为「深度研究专用」而非通用 Agent 平台。 这种坦诚态度赢得了开发者社区的高度信任。

其 GitHub 主页显示主要关注方向为:AI Agent、Deep Research、RAG、知识图谱。 晚黎的写作风格务实,文档以英文为主但在中文社区同样活跃。

AI Researcher Deep Research RAG Knowledge Graph Open Source
09

竞品对比

产品 架构 记忆 工具 安全 开源 定位
DeerFlow LangGraph 三层记忆 6+ 内置 沙箱隔离 ✓ 完整 深度研究
Manus Monolithic 会话级 闭源生态 黑盒 通用助手
OpenAI Deep Research 闭源 Agent 会话级 内置搜索 闭源 深度研究
LangChain Agents LangChain 可配置 灵活集成 自托管 开发框架
CrewAI Multi-Agent 基础 Task 导向 自托管 多Agent协作
DeerFlow 核心差异化
完全开源

完整源码可审计,企业可私有化部署,数据不出境,满足合规要求。

研究深度

三层记忆架构专为长期研究任务设计,跨会话知识复用能力显著优于同类方案。

Human-in-Loop

关键节点人工审批机制,确保高风险操作可控,适合企业级应用场景。

10

安全考量

沙箱执行

代码执行在 Docker 容器隔离环境中进行,严格限制系统级调用与网络访问。

超时控制 + 资源配额,防止恶意代码消耗计算资源。

DockerNamespaceSeccomp
敏感操作审批

文件写入、网络请求、外部API调用等敏感操作强制触发人工审批流程。

可配置审批规则与自动放行白名单。

数据隔离

向量数据库与知识图谱支持多租户隔离,数据按租户/项目维度分区存储。

Redis 会话数据支持 TTL 自动过期与手动清除。

API 安全
认证 API Key / OAuth 2.0
速率限制 ✓ 启用
加密传输 TLS 1.3
日志审计 完整记录
11

生态系统

官方文档
deer-flow.dev

完整的部署指南、API 参考、示例项目与架构说明。

GitHub
bytedance/deer-flow

Issue tracker、PR 社区贡献、Releases 下载与 CI/CD 状态。

Discord 社区
实时讨论

开发者交流、问题求助、案例分享与功能讨论。

集成生态
LangSmith Weights & Biases Langfuse OpenTelemetry Prometheus Grafana Kubernetes Docker Compose Hugging Face Qdrant Chroma Redis
12

总结与展望

架构成熟度
8.5/10
LangGraph + 三层记忆
工具生态
7.0/10
6+ 内置 + 自定义接口
社区活跃度
9.0/10
28.6K Stars · 高迭代频率
企业就绪
6.5/10
安全机制完善 · 自改进 Beta
未来路线图方向
  • 多Agent协作 — 支持子Agent分工与信息共享
  • 知识图谱增强 — 实时推理与动态关系更新
  • 企业SSO集成 — LDAP / SAML / OIDC
  • 多语言文档处理 — 中文、日文、韩文优化
  • 云原生部署 — Kubernetes Operator
  • 性能基准测试 — 标准化评测体系
13

版本演进路线

v0.1.1 2025.11.25
项目正式启动
DeerFlow 正式发布首个版本,确立核心架构 —— LangGraph 驱动的深度研究 Agent 系统。首批功能包括基础网页搜索、文档读取与简单报告生成。
v0.2 → v0.4 2025.12 — 2026.01
快速迭代期
密集发布多个版本:引入 Python 代码沙箱执行、Docker 容器化部署、多模型支持(Claude/GPT-4/Gemini)、WebSocket 实时通信与心跳上报机制。
v0.5.x 2026.01
消息平台集成
新增飞书(Lark)、Slack、Discord 消息推送集成,支持研究结果自动同步至团队协作平台。增加企业微信 Webhook 通知支持。
v0.6.x 2026.01.28
爆发式增长
DeerFlow 在社交媒体引发广泛关注,GitHub Stars 从数千快速增长至 5 万+。同期 Manus 发布,进一步推动市场对 AI Agent 的关注热度。DeerFlow 因开源透明度获得开发者青睐。
v1.0 → v2.0 2026.02 — 2026.03
企业级功能扩展
v1.0 正式发布,引入三层记忆架构与知识图谱支持。v2.0 推出 Human-in-the-Loop 审批机制、自改进实验系统、Kubernetes 部署方案与企业 SSO 集成。
v2.4.6 2026.04.03
当前稳定版本
最新版本完善了错误恢复机制,增加了多语言文档处理优化(特别是中文 PDF 解析),改进了心跳上报稳定性,并修复了 47 个社区反馈问题。
总版本数
81
跨度
130
日均版本
0.62
Commit
3200+
14

参考来源