Deep Research Report

Hermes Agent

开源多模态 CLI Agent 框架 — 具备自我迭代能力的生产级 AI Agent 系统

// EXECUTIVE SUMMARY

Hermes Agent 是由 NousResearch 开源的多模态 CLI Agent 框架,核心亮点在于 ACP(Agent Communication Protocol)多智能体通信协议、 三层记忆系统(Episodic / Semantic / Procedural)、 ⭐ 双层自我迭代机制(运行时自主创建/修补 Skills + 离线 GEPA 遗传优化)、 远程终端执行能力,以及 Skills Marketplace 生态。支持 WhatsApp 等平台接入,适合构建具备"学会学习"能力的生产级 AI Agent 系统。

01

项目概览

Hermes AgentNousResearch 团队开发和维护,以 Nous Hermes 模型为主干模型驱动,定位为生产级多智能体系统。团队成员来自 AI 社区多个活跃项目(如 Aphrodite 推理引擎),具备扎实的 LLM 系统工程背景。

其核心设计围绕五个关键问题:Agent 如何记忆长期经验?多 Agent 如何通信?如何可靠执行远程操作?如何扩展能力边界?Agent 如何自我进化

MIT 开源 CLI-First 多平台
02

技术架构

SYSTEM ARCHITECTURE

Skills / Plugins ← 可扩展技能系统
Tools System ← 工具执行层
Memory System (3-Layer) ← Episodic / Semantic / Procedural
Agent Loop ← 核心推理循环
Gateway Layer ← 通信协议层
ACP (Agent Communication Protocol) ← 多 Agent 协议

AGENT LOOP — 执行引擎

Step 1
接收指令
Step 2
规划行动
Step 3
调用工具
Step 4
更新记忆
Step 5
迭代反馈

MEMORY SYSTEM — 三层记忆架构

Episodic

情景记忆

记录 Agent 在特定场景下的交互历史,类似"经历"

对话日志、任务执行序列
Semantic

语义记忆

存储结构化的知识事实,可跨场景检索

知识图谱、概念关系
Procedural

程序记忆

记录"如何做"的流程性知识,自动化工作流

Skills、宏、脚本

SKILLS SYSTEM — 自我迭代核心 ⭐

Skills 是 Hermes Agent 的扩展单元,也是其 Procedural Memory 的载体。与一般框架不同,Hermes Agent 的 Skills 系统具备自主创建、修改、进化的能力

操作说明
create自动创建新 Skill
patch对现有 Skill 做针对性修补(首选方式,Token 高效)
edit对 Skill 做结构性重写
delete删除不再需要的 Skill
write_file / remove_file为 Skill 编写/移除参考文档、模板、脚本等
03

ACP 协议

Agent Communication Protocol — 核心创新之一,解决多智能体系统中的互操作性、任务委派和状态同步问题。

🔗 点对点通信

// Peer-to-Peer
Agent A → Agent B:
  [指令 + 上下文]
Agent B → Agent A:
  [结果 + 反馈]

📡 发布-订阅

// Pub/Sub
Agent A 发布事件 →
所有订阅 Agent
接收通知

🎯 任务委派

// Delegation
主 Agent → 子 Agent:
  分解任务
子 Agent → 返回结果
主 Agent → 整合输出

跨平台消息路由

💬
WhatsApp
移动端消息
🤖
TG / Discord
社区平台
🔌
WebSocket
实时 Web
⌨️
CLI
终端交互
🌐
REST API
外部集成
🖥️
SSH
远程终端
04

远程终端执行

远程终端执行能力使 Agent 不仅是对话助手,更是运维级工具:

🖥️

SSH 执行

SSH 到远程服务器执行命令

🚀

自动部署

自动化部署和运维任务

🔗

跨机协作

跨机器协作执行复杂脚本

📊

实时监控

实时监控和日志分析

05

Skills 生态

Skills Marketplace

📊
ETL
数据处理
🔌
API
第三方集成
🛠️
Dev
开发工具
💼
Biz
业务逻辑

自定义 Skill 示例

Python
from hermes_agent.skills import Skill, skill_registry

class MyCustomSkill(Skill):
    name = "my_custom_skill"
    description = "执行自定义业务逻辑"

    async def execute(self, params: dict) -> dict:
        # 业务逻辑
        return {"result": "success"}

skill_registry.register(MyCustomSkill())

Skills vs Tools

维度ToolSkill
复杂度简单原子操作复杂多步骤流程
粒度细粒度粗粒度
依赖管理独立可能依赖其他 Skills
适用场景单一操作复杂业务场景
06

⭐ 自我迭代与进化机制

// CORE HIGHLIGHT

Hermes Agent 确实具备自我迭代更新 Skills 的能力,且分两个层级实现——运行时自主管理离线进化优化

▶ 运行时自我改进(全自动)

触发
用户指令
执行
Agent 执行
检测
复杂/错误/新流程
创建
skill_manage
持久化
~/.hermes/skills/
🔄

自主触发

完成复杂任务、解决错误、被用户纠正后自动触发

📈

渐进式改进

发现 Skill 有缺陷或过时,立即执行 patch 修补

💾

跨会话持久化

Skills 跨对话和会话持久保存

🔍

FTS5 会话搜索

全文搜索检索历史对话,LLM 摘要实现跨会话经验回溯

⚡ 离线进化优化(DSPy + GEPA)

基于 DSPy + GEPA(Genetic-Pareto Prompt Evolution) 实现,来自 ICLR 2026 Oral 论文。需人工审核合并。

Read
读取 Skill
Dataset
评估数据集
GEPA
优化器
Gate
约束门控
PR
人工审核

五阶段演进路线

PHASE 1

Skill 文件优化

SKILL.md 文件的结构性优化
✦ 已实现
PHASE 2

工具描述优化

Tool descriptions 的语义增强
◇ 计划中
PHASE 3

系统提示词优化

System prompts 的自动进化
◇ 计划中
PHASE 4

工具实现代码

Darwinian Evolver 优化代码
◇ 计划中
PHASE 5

持续改进闭环

全自动检测+优化+部署管道
◇ 计划中

关键保障机制

100%
测试通过率
🔒
Token 限制
🔍
语义漂移检测
缓存兼容性

两层机制对比

维度运行时自我改进离线进化优化
需要 GPU❌ 纯 API❌ 纯 API
人工介入完全自主需 PR 审核
触发方式Agent 自动Agent 主动 / 手动
优化深度修补和增量改进遗传算法结构性优化
成本极低~$2-10 / 次
适用场景日常经验积累针对性质量提升
07

框架对比

特性 Hermes Agent LangChain AutoGen CrewAI
⭐ 自我迭代 双层机制
通信协议 ACP(专用) LangChain Agents Multi-Agent Role-based
记忆系统 三层记忆 向量存储 有限 简单
远程执行 ✓ 原生
多平台接入 WhatsApp/TG 等 可扩展 自行实现 有限
CLI 优先
许可证 MIT MIT MIT Apache 2.0

自我迭代能力

Agent 可自主创建、修补、进化 Skills,具备"学会学习"的闭环能力

🧠

三层记忆系统

记忆分层比单纯的向量检索更接近人类认知

💻

远程终端执行

极少数框架具备的运维级 Agent 能力

08

快速开始

Bash
# 安装(推荐使用 uv)
uv pip install hermes-agent

# 初始化配置
hermes init

# 设置 API Key
export OPENAI_API_KEY="sk-xxxxx"

# 启动 Agent
hermes run
hermes run --model nous-hermes-2
hermes run --skills search,coding
hermes serve --port 8080
Python ≥ 3.10 pip / uv OpenAI API Key
09

应用场景

🤖

个人 AI 助手

通过 WhatsApp 或 Telegram 接入,成为随身携带的 AI 助手,结合三层记忆持续学习用户偏好。

👥

开发团队协作

多个专业 Agent(代码审查、测试、部署)通过 ACP 协作,覆盖软件开发生命周期。

🚀

DevOps 自动化

Agent 通过 SSH 远程执行命令,配合记忆系统记录部署历史和故障排查经验。

🏢

企业知识管理

Semantic Memory 存储企业知识图谱,Procedural Memory 自动化业务流程,Episodic Memory 记录项目交互历史。

10

总结与评价

Hermes Agent 是目前开源社区中设计最为系统化的 Agent 框架之一。

其三层记忆架构、ACP 协议和自我迭代能力体现了对 AI Agent 本质的深度思考,而非简单的"LLM + Tools"堆叠。尤其是其双层自我进化机制(运行时自主管理 + 离线 GEPA 遗传优化),在开源 Agent 框架中独树一帜。

✦ 核心优势

  • ⭐ 自我迭代能力 — 具备"学会学习"的闭环,开源极为罕见
  • 🧠 三层记忆系统 — 贴近人类认知模型
  • 🔗 ACP 协议 — 多 Agent 通信方案完整且有创新性
  • 💻 远程执行能力 — Agent 框架中较为罕见
  • 🧩 Skills 生态 — 可扩展性强,社区可共建
  • 📱 多平台接入 — Gateway 设计支持丰富渠道

◇ 待观察

  • 离线进化优化(Phase 2-5)仍处于计划阶段
  • 文档完整度仍在持续建设中
  • 企业级特性(安全审计、高可用)尚未成熟
  • 与主流 MLOps 工具链的集成有待丰富

适合引入的场景

场景 1
需要 Agent 持续学习、自我进化的长期运行系统
场景 2
需要多 Agent 协作的生产系统
场景 3
希望 Agent 具备远程执行能力的 DevOps 团队
场景 4
研究多智能体通信和 Agent 自我进化的学术团队
REF

参考来源