一、为什么需要本地AI Agent框架

在进入技术细节之前,需要理解这类框架解决的核心问题。GPT-4、Claude 3.5等大语言模型已经具备强大的推理能力,但直接使用存在三个致命缺陷:无法记住跨会话信息、无法调用外部工具、无法稳定执行任务。本地Agent框架正是为解决这三个问题而设计。

OpenClaw和Hermes Agent都在这个方向上发力,但采用了截然不同的技术路线。

二、OpenClaw技术架构详解

2.1 核心架构:Hub-and-Spoke模式

OpenClaw采用经典的"中心辐射"架构,以Gateway(网关)作为控制平面核心。Gateway是一个持续运行的守护进程,负责接收来自WhatsApp、iMessage、Slack、Discord等渠道的用户输入,然后分发给相应的Agent会话处理。

Gateway的核心设计理念是"输入即事件"——不仅包括用户消息,还包括定时心跳(Cron)、webhook回调、Agent间通信等。这使得OpenClaw可以构建真正主动工作的Agent,而不是被动等待用户输入。

2.2 工作空间文件系统

OpenClaw最独特的设计是将Agent的"大脑"分散在文件系统中。工作空间默认位于~/.openclaw/workspace/,包含以下核心文件:

  • SOUL.md - Agent人格定义

  • AGENTS.md - 会话逻辑和检查清单

  • USER.md - 用户模型

  • IDENTITY.md - Agent自我认知

  • MEMORY.md - 长期记忆

  • TOOLS.md - 工具配置

SOUL.md是Agent的人格核心,定义其性格、沟通风格和行为边界。AGENTS.md定义每次会话的执行逻辑。

2.3 记忆系统三层架构

OpenClaw的记忆系统分为三个层次:

  • Layer 3 长期记忆:MEMORY.md存储精心筛选的洞察、决策、偏好

  • Layer 2 每日日志:memory/YYYY-MM-DD.md记录原始每日笔记

  • Layer 1 会话上下文:当前对话的Token序列

OpenClaw选择不使用主流的RAG架构,而是采用文件+上下文的方式,让记忆完全透明可审计。

2.4 技能系统:Markdown即技能

OpenClaw的技能系统是其最强大的扩展机制。每个技能是一个SKILL.md文件,包含特定能力的完整指令。用户不需要写代码,只需按照规范编写Markdown,就能为Agent添加新功能。

2.5 安全机制

OpenClaw内置多层安全机制:设备配对(新设备需要显式授权)、会话沙箱(不信任的会话在隔离环境中运行)、命令审批(敏感操作需要用户确认)、上下文压缩(自动总结旧对话防止Token溢出)。

三、Hermes Agent技术架构详解

3.1 核心架构:自我进化循环

Hermes Agent的核心是AIAgent执行循环——一个"执行→记录→反思→改进"的闭环。每次用户交互,Hermes都会记录完整的执行轨迹。成功的流程会被自动转化为可复用技能,失败的经验会触发提示词优化。这种机制使得Hermes越用越强。

Auto

执行 → 记录轨迹 → 反思 → 学习技能
                     ↓
              优化提示词 ←

3.2 目录结构与配置

Hermes的工作目录位于~/.hermes/,结构如下:

Auto

~/.hermes/
├── config.yaml     # 主配置
├── .env            # API密钥
├── memories/       # 记忆文件
├── skills/         # Agent自创技能
├── sessions/       # 会话历史
├── cron/          # 定时任务
└── state.db       # SQLite主数据库

3.3 记忆系统

Hermes使用SQLite存储会话历史,配合FTS5实现全文搜索。每次会话结束后,Agent会自动总结并存储关键信息。

3.4 技能系统

Hermes的技能既可以手动创建,也可以自动生成。当Agent成功完成一个任务后,它会自动创建一个技能文件。手动创建技能需要在~/.hermes/skills/目录下创建Markdown文件,与OpenClaw的SKILL.md格式兼容。

3.5 多后端执行环境

Hermes支持六种执行后端:本地、Docker、SSH、Daytona、Singularity、Modal。Daytona和Modal后端支持无服务器持久化——环境空闲时会休眠,几乎不产生费用。

3.6 MCP服务器支持

Hermes支持MCP(Model Context Protocol)服务器,可以连接各种外部服务。

四、技术细节深度对比

## 4.1 架构哲学对比

| 维度 | OpenClaw | Hermes Agent |
|------|----------|--------------|
| 核心架构 | 中央协调器(Gateway) | 自主执行循环 |
| 设计理念 | 控制平面优先 | 学习进化优先 |

## 4.2 记忆系统对比

| 维度 | OpenClaw | Hermes Agent |
|------|----------|--------------|
| 存储方式 | 文件系统(Markdown) | SQLite + 文件 |
| 搜索方式 | BM25 + 向量混合 | FTS5 + LLM摘要 |

## 4.3 技能系统对比

| 维度 | OpenClaw | Hermes Agent |
|------|----------|--------------|
| 创建方式 | 人类编写 | 自动生成+手动创建 |
| 格式 | SKILL.md | SKILL.md(兼容) |

五、使用方法详解

## 5.1 OpenClaw使用流程

**第一步:安装**

npm install -g @open-swc/openclaw

**第二步:配置工作空间**

mkdir -p ~/.openclaw/workspace
cd ~/.openclaw/workspace
touch SOUL.md AGENTS.md USER.md MEMORY.md IDENTITY.md TOOLS.md

**第三步:启动**

openclaw start --port 18789

## 5.2 Hermes Agent使用流程

**安装**

pip install hermes-agent
mkdir -p ~/.hermes/{cron,sessions,logs,memories,skills,hooks}
hermes start

六、融合之路

Hermes内置了从OpenClaw迁移的工具:

hermes claw migrate --source ~/.openclaw/workspace

用OpenClaw构建可控的技能体系,用Hermes实现持续的学习进化,这才是AI Agent的最佳实践。


总结

| 维度 | OpenClaw | Hermes Agent |
|------|----------|--------------|
| 定位 | 控制平面优先 | 学习进化优先 |
| 架构 | Gateway中央协调 | AIAgent自主循环 |
| 技能 | 人类编写 | 自动+手动 |
| 适合场景 | 企业、精确、可审计 | 个人、学习、进化 |


撰写时间:2026 年 4 月 10 日
分类:AI技术
标签:AI Agent、Hermes Agent、OpenClaw、人工智能、机器学习
内容由AI生成