开源多模态 CLI Agent 框架 — 具备自我迭代能力的生产级 AI Agent 系统
Hermes Agent 是由 NousResearch 开源的多模态 CLI Agent 框架,核心亮点在于 ACP(Agent Communication Protocol)多智能体通信协议、 三层记忆系统(Episodic / Semantic / Procedural)、 ⭐ 双层自我迭代机制(运行时自主创建/修补 Skills + 离线 GEPA 遗传优化)、 远程终端执行能力,以及 Skills Marketplace 生态。支持 WhatsApp 等平台接入,适合构建具备"学会学习"能力的生产级 AI Agent 系统。
Hermes Agent 由 NousResearch 团队开发和维护,以 Nous Hermes 模型为主干模型驱动,定位为生产级多智能体系统。团队成员来自 AI 社区多个活跃项目(如 Aphrodite 推理引擎),具备扎实的 LLM 系统工程背景。
其核心设计围绕五个关键问题:Agent 如何记忆长期经验?多 Agent 如何通信?如何可靠执行远程操作?如何扩展能力边界?Agent 如何自我进化?
记录 Agent 在特定场景下的交互历史,类似"经历"
存储结构化的知识事实,可跨场景检索
记录"如何做"的流程性知识,自动化工作流
Skills 是 Hermes Agent 的扩展单元,也是其 Procedural Memory 的载体。与一般框架不同,Hermes Agent 的 Skills 系统具备自主创建、修改、进化的能力。
| 操作 | 说明 |
|---|---|
| create | 自动创建新 Skill |
| patch | 对现有 Skill 做针对性修补(首选方式,Token 高效) |
| edit | 对 Skill 做结构性重写 |
| delete | 删除不再需要的 Skill |
| write_file / remove_file | 为 Skill 编写/移除参考文档、模板、脚本等 |
Agent Communication Protocol — 核心创新之一,解决多智能体系统中的互操作性、任务委派和状态同步问题。
远程终端执行能力使 Agent 不仅是对话助手,更是运维级工具:
SSH 到远程服务器执行命令
自动化部署和运维任务
跨机器协作执行复杂脚本
实时监控和日志分析
from hermes_agent.skills import Skill, skill_registry class MyCustomSkill(Skill): name = "my_custom_skill" description = "执行自定义业务逻辑" async def execute(self, params: dict) -> dict: # 业务逻辑 return {"result": "success"} skill_registry.register(MyCustomSkill())
| 维度 | Tool | Skill |
|---|---|---|
| 复杂度 | 简单原子操作 | 复杂多步骤流程 |
| 粒度 | 细粒度 | 粗粒度 |
| 依赖管理 | 独立 | 可能依赖其他 Skills |
| 适用场景 | 单一操作 | 复杂业务场景 |
Hermes Agent 确实具备自我迭代更新 Skills 的能力,且分两个层级实现——运行时自主管理和离线进化优化。
完成复杂任务、解决错误、被用户纠正后自动触发
发现 Skill 有缺陷或过时,立即执行 patch 修补
Skills 跨对话和会话持久保存
全文搜索检索历史对话,LLM 摘要实现跨会话经验回溯
基于 DSPy + GEPA(Genetic-Pareto Prompt Evolution) 实现,来自 ICLR 2026 Oral 论文。需人工审核合并。
| 维度 | 运行时自我改进 | 离线进化优化 |
|---|---|---|
| 需要 GPU | ❌ 纯 API | ❌ 纯 API |
| 人工介入 | 完全自主 | 需 PR 审核 |
| 触发方式 | Agent 自动 | Agent 主动 / 手动 |
| 优化深度 | 修补和增量改进 | 遗传算法结构性优化 |
| 成本 | 极低 | ~$2-10 / 次 |
| 适用场景 | 日常经验积累 | 针对性质量提升 |
| 特性 | Hermes Agent | LangChain | AutoGen | CrewAI |
|---|---|---|---|---|
| ⭐ 自我迭代 | 双层机制 | ✕ | ✕ | ✕ |
| 通信协议 | ACP(专用) | LangChain Agents | Multi-Agent | Role-based |
| 记忆系统 | 三层记忆 | 向量存储 | 有限 | 简单 |
| 远程执行 | ✓ 原生 | ✕ | ✕ | ✕ |
| 多平台接入 | WhatsApp/TG 等 | 可扩展 | 自行实现 | 有限 |
| CLI 优先 | ✓ | ✕ | ✕ | ✕ |
| 许可证 | MIT | MIT | MIT | Apache 2.0 |
Agent 可自主创建、修补、进化 Skills,具备"学会学习"的闭环能力
记忆分层比单纯的向量检索更接近人类认知
极少数框架具备的运维级 Agent 能力
# 安装(推荐使用 uv) uv pip install hermes-agent # 初始化配置 hermes init # 设置 API Key export OPENAI_API_KEY="sk-xxxxx" # 启动 Agent hermes run hermes run --model nous-hermes-2 hermes run --skills search,coding hermes serve --port 8080
通过 WhatsApp 或 Telegram 接入,成为随身携带的 AI 助手,结合三层记忆持续学习用户偏好。
多个专业 Agent(代码审查、测试、部署)通过 ACP 协作,覆盖软件开发生命周期。
Agent 通过 SSH 远程执行命令,配合记忆系统记录部署历史和故障排查经验。
Semantic Memory 存储企业知识图谱,Procedural Memory 自动化业务流程,Episodic Memory 记录项目交互历史。
Hermes Agent 是目前开源社区中设计最为系统化的 Agent 框架之一。
其三层记忆架构、ACP 协议和自我迭代能力体现了对 AI Agent 本质的深度思考,而非简单的"LLM + Tools"堆叠。尤其是其双层自我进化机制(运行时自主管理 + 离线 GEPA 遗传优化),在开源 Agent 框架中独树一帜。