DeerFlow 深度研究报告

01

执行摘要

DeerFlow 是字节跳动（ByteDance）于2025年11月开源的深度研究型AI Agent框架。项目以 bytedance/deer-flow 为核心，通过 LangGraph 实现复杂工作流的有向图编排，将大型语言模型（LLM）的推理能力与外部工具系统深度融合。

截至2026年4月，项目已积累 28.6K Stars、3,200+ Commits、 81个版本迭代，成为AIAgent开源领域最受关注的明星项目之一。其设计理念强调「人类在环（Human-in-the-Loop）」—— 在AI自主执行与人类监督之间建立精妙的平衡机制。

架构模式

LangGraph

有向图工作流编排

记忆系统

分层

短期 · 长期 · 语义三重记忆

心跳机制

Active

实时状态上报与监控

自改进

Beta

Agent自优化工作流

02

技术架构

Gateway Layer

REST API + FastAPI

提供标准化HTTP接口，支持会话管理、任务提交与结果查询。统一入口简化集成复杂度。

FastAPIUvicornCORS

Orchestration

LangGraph Engine

有向无环图（DAG）驱动的Agent编排引擎，支持条件分支、并行执行与状态持久化。

LangGraphStateGraphDAG

Agent Core

Research Agent

核心推理Agent，负责任务规划、工具调用决策与结果整合。采用ReAct范式。

ReActTool UsePlanning

Memory System

Triple-Layer Memory

短期会话记忆 → 长期向量存储 → 语义知识图谱，三层递进式记忆架构。

RedisVector DBKG

Tool System

Sandboxed Executor

隔离沙箱环境执行代码、搜索等敏感操作，内置Bash/Python/Docker多运行时。

SandboxBashDocker

Human-in-the-Loop

Approval + Revision

关键节点暂停等待人工确认，支持计划审查、结果修订与进度实时追踪。

ApprovalWebSocketReview

03

记忆系统

短期记忆

Session Context

基于 Redis 的会话上下文管理，维护当前对话轮次的完整状态。包括用户输入历史、Agent中间推理结果、工具调用记录。随会话结束自动清理，生命周期精确可控。

长期记忆

Vector Store

Chroma/Qdrant 等向量数据库存储历史研究片段，支持语义相似度检索。跨会话积累知识片段，自动关联相关历史研究。支持增量更新与定期向量化索引重建。

语义记忆

Knowledge Graph

结构化知识图谱记录实体关系（公司、人、技术、事件）。支持复杂推理路径，增强跨文档关联分析能力。可与向量记忆互补，提供精确关系查询。

记忆流转机制

用户输入 → 短期记忆（Redis）实时上下文 → LLM推理生成计划 → 工具执行 → 结果写入向量库 → 定期抽取实体关系同步至知识图谱 → 长期记忆复用

Input Short-term Inference Vector KG Sync

04

心跳与自动化

心跳上报机制

Agent执行过程中定时向服务端发送心跳，包含：当前节点状态、已完成步骤数、预估剩余时间、Token消耗统计。

服务端可据此实现实时进度追踪、异常检测与动态资源调配。

上报频率每30秒

协议 WebSocket / HTTP

超时阈值 120秒

超时策略自动重试 + 告警

自动化编排

基于 LangGraph 的 DAG 定义，支持条件分支、循环与并行子图。

内置定时触发、Webhook回调、事件驱动三种自动化模式，实现无人值守的批量研究任务。

Cron Trigger Webhook Event Bus Batch Mode

Active Paused Scheduled

05

工具系统

Web Search

信息检索

集成 Tavily、DuckDuckGo、Baidu 等多个搜索引擎，支持去重合并与结果质量评分。

TavilyDuckDuckGoSerpAPI

Code Executor

代码执行

隔离沙箱中执行 Python/Bash 代码，结果实时捕获返回，支持数据可视化渲染。

PythonBashDocker

Document Reader

文档解析

支持 PDF、Markdown、HTML、TXT 等多格式文档内容提取，自动识别元数据与章节结构。

PDFMarkdownHTML

Web Fetcher

网页抓取

通用网页内容抓取，支持动态渲染页面（JavaScript），自动处理反爬机制与速率限制。

PlaywrightSeleniumStatic

Image Analysis

图像理解

多模态模型支持图表、截图、信息图等视觉内容的深度理解与描述生成。

GPT-4VClaude-VGemini

Custom Tools

自定义工具

开放工具注册接口，支持企业自建API集成、知识库查询、业务系统对接等定制需求。

Plugin APIRESTgRPC

06

自改进系统

EXPERIMENTAL 该功能为实验性阶段，API 可能发生变化

DeerFlow 的自改进系统允许 Agent 在运行过程中自动识别自身不足，通过反馈循环持续优化工具调用策略、Prompt 模板与执行路径。系统会记录每次失败的推理尝试，并在后续任务中避免重复错误。

工作流程

执行 — Agent 完成任务推理与工具调用
评估 — 对输出质量进行多维度评分
反思 — 识别失败模式与改进方向
更新 — 修改 Prompt/策略并存入长期记忆
验证 — 在新任务中验证改进效果

改进维度

工具选择优化中

Prompt 模板优化中

执行路径待实现

错误恢复待实现

07

AI 模型支持

模型	支持角色	多模态	工具调用	状态
Claude (Anthropic)	Researcher / Coder / Planner	✓ Vision	✓ 原生支持	推荐
GPT-4o / GPT-4.5 (OpenAI)	Researcher / Coder	✓ 原生	✓ 函数调用	推荐
Gemini (Google)	Researcher / Coder	✓ 原生	✓ 函数调用	Beta
DeepSeek	Researcher	—	✓	Beta
Qwen (阿里通义)	Researcher	✓ Vision	✓	Beta
GLM / Zhipu	Researcher	—	✓	Beta

模型选择建议

追求深度研究质量

优先选择 Claude 3.7 Sonnet / Claude 3.5 Sonnet，其长上下文窗口与推理能力最适合复杂研究任务。

平衡成本与性能

GPT-4o 提供良好的性价比，支持函数调用与多模态，适合日常研究与文档分析场景。

08

创始人故事

晚黎 / Wanli

字节跳动 · AI研究员 · DeerFlow 核心作者

DeerFlow 的核心作者「晚黎」是字节跳动的前 AI 研究员，以在社交媒体上活跃分享 AI 技术见解而闻名。他于 2025 年 11 月 25 日正式发布 DeerFlow v0.1.1，并在随后数月内以极高频率迭代推进项目。

晚黎的公开分享风格直接、真诚，多次在 X/Twitter 上承认 DeerFlow 与 Manus 的设计相似性，并明确表示项目定位为「深度研究专用」而非通用 Agent 平台。这种坦诚态度赢得了开发者社区的高度信任。

其 GitHub 主页显示主要关注方向为：AI Agent、Deep Research、RAG、知识图谱。晚黎的写作风格务实，文档以英文为主但在中文社区同样活跃。

AI Researcher Deep Research RAG Knowledge Graph Open Source

09

竞品对比

产品	架构	记忆	工具	安全	开源	定位
DeerFlow	LangGraph	三层记忆	6+ 内置	沙箱隔离	✓ 完整	深度研究
Manus	Monolithic	会话级	闭源生态	黑盒	✗	通用助手
OpenAI Deep Research	闭源 Agent	会话级	内置搜索	闭源	✗	深度研究
LangChain Agents	LangChain	可配置	灵活集成	自托管	✓	开发框架
CrewAI	Multi-Agent	基础	Task 导向	自托管	✓	多Agent协作

DeerFlow 核心差异化

完全开源

完整源码可审计，企业可私有化部署，数据不出境，满足合规要求。

研究深度

三层记忆架构专为长期研究任务设计，跨会话知识复用能力显著优于同类方案。

Human-in-Loop

关键节点人工审批机制，确保高风险操作可控，适合企业级应用场景。

10

安全考量

沙箱执行

代码执行在 Docker 容器隔离环境中进行，严格限制系统级调用与网络访问。

超时控制 + 资源配额，防止恶意代码消耗计算资源。

DockerNamespaceSeccomp

敏感操作审批

文件写入、网络请求、外部API调用等敏感操作强制触发人工审批流程。

可配置审批规则与自动放行白名单。

数据隔离

向量数据库与知识图谱支持多租户隔离，数据按租户/项目维度分区存储。

Redis 会话数据支持 TTL 自动过期与手动清除。

API 安全

认证 API Key / OAuth 2.0

速率限制 ✓ 启用

加密传输 TLS 1.3

日志审计完整记录

11

生态系统

官方文档

deer-flow.dev

完整的部署指南、API 参考、示例项目与架构说明。

GitHub

bytedance/deer-flow

Issue tracker、PR 社区贡献、Releases 下载与 CI/CD 状态。

Discord 社区

实时讨论

开发者交流、问题求助、案例分享与功能讨论。

集成生态

LangSmith Weights & Biases Langfuse OpenTelemetry Prometheus Grafana Kubernetes Docker Compose Hugging Face Qdrant Chroma Redis

12

总结与展望

架构成熟度

8.5/10

LangGraph + 三层记忆

工具生态

7.0/10

6+ 内置 + 自定义接口

社区活跃度

9.0/10

28.6K Stars · 高迭代频率

企业就绪

6.5/10

安全机制完善 · 自改进 Beta

未来路线图方向

→ 多Agent协作 — 支持子Agent分工与信息共享
→ 知识图谱增强 — 实时推理与动态关系更新
→ 企业SSO集成 — LDAP / SAML / OIDC

→ 多语言文档处理 — 中文、日文、韩文优化
→ 云原生部署 — Kubernetes Operator
→ 性能基准测试 — 标准化评测体系

13

版本演进路线

v0.1.1 2025.11.25

项目正式启动

DeerFlow 正式发布首个版本，确立核心架构 —— LangGraph 驱动的深度研究 Agent 系统。首批功能包括基础网页搜索、文档读取与简单报告生成。

v0.2 → v0.4 2025.12 — 2026.01

快速迭代期

密集发布多个版本：引入 Python 代码沙箱执行、Docker 容器化部署、多模型支持（Claude/GPT-4/Gemini）、WebSocket 实时通信与心跳上报机制。

v0.5.x 2026.01

消息平台集成

新增飞书（Lark）、Slack、Discord 消息推送集成，支持研究结果自动同步至团队协作平台。增加企业微信 Webhook 通知支持。

v0.6.x 2026.01.28

爆发式增长

DeerFlow 在社交媒体引发广泛关注，GitHub Stars 从数千快速增长至 5 万+。同期 Manus 发布，进一步推动市场对 AI Agent 的关注热度。DeerFlow 因开源透明度获得开发者青睐。

v1.0 → v2.0 2026.02 — 2026.03

企业级功能扩展

v1.0 正式发布，引入三层记忆架构与知识图谱支持。v2.0 推出 Human-in-the-Loop 审批机制、自改进实验系统、Kubernetes 部署方案与企业 SSO 集成。

v2.4.6 2026.04.03

当前稳定版本

最新版本完善了错误恢复机制，增加了多语言文档处理优化（特别是中文 PDF 解析），改进了心跳上报稳定性，并修复了 47 个社区反馈问题。

总版本数

81

跨度

130天

日均版本

0.62

Commit

3200+

14

参考来源

GitHub - bytedance/deer-flow — 官方源代码仓库
DeerFlow Documentation — 官方技术文档
LangGraph Documentation — 工作流编排引擎
Anthropic Claude — AI 模型支持
OpenAI Platform — GPT 模型支持
Chroma Documentation — 向量数据库
Qdrant Documentation — 高性能向量检索
Docker Documentation — 容器化部署
Kubernetes Documentation — 云原生编排
X/Twitter - DeerFlow Discussion — 社区讨论