OpenClaw与Hermes入门基础教程(非常详细),收藏这一篇就够了!

张开发
2026/4/13 23:17:09 15 分钟阅读

分享文章

OpenClaw与Hermes入门基础教程(非常详细),收藏这一篇就够了!
最近 Hermes Agent 很火媒体、Reddit 上I ditched OpenClaw for Hermes的帖子接连不断国内也有不少朋友在问同一个问题它们到底是同一类东西吗Hermes 能直接替代 OpenClaw 吗这个问题正好点中了最容易混淆的地方。先把共识摆出来OpenClaw 和 Hermes 都属于通用 Agent 系统。它们都不是单点脚本也不是某个聊天渠道里的 bot。它们都在尝试把模型、工具、会话、记忆、Skills、消息入口和本地运行环境接成一套可以长期使用的系统。大家觉得它们像完全正常。它们都聊 Gateway都聊 Skills都聊 Memory都能接聊天入口也都关心本地化、工具权限和用户数据迁移。但工程重心完全不同。OpenClaw 更像一个本地优先的 Agent Gateway重点是把真实世界的入口、会话、设备和权限接起来。Hermes 更像一个学习型 Agent Runtime重点是让 Agent 在执行过程中沉淀经验下次少走弯路。之前几篇文章里我们分别梳理过 OpenClaw 的作业系统味道拆过它最容易混的渠道、账号、Agent、会话、记忆五层关系也拆过 Hermes 的闭环学习循环和源码实现。具体可以看下我们的往期推文。本文把它们放在同一张思考里。不是为了吹嘘谁更强更厉害而是让我们一起来了解和深入分析这两个通用 Agent 的区别是什么它们到底在解决哪一层问题。太长不看版•它们确实是同一大类东西。OpenClaw 和 Hermes 都可以理解为通用 Agent 系统都不只是聊天机器人也不只是工具集合。•OpenClaw 的核心资产是 Gateway 控制面。它把 WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Matrix、Feishu、LINE、WeChat、WebChat 等入口接进来再用 Gateway 管会话、路由、节点、工具和安全策略。•Hermes 的核心资产是学习型执行循环。它强调 self-improving agent、closed learning loop、自动创建和修补 skills、FTS5 会话搜索、Honcho 用户建模以及本地、Docker、SSH、Daytona、Singularity、Modal 六种执行后端。•两者都有 Skill但语义不同。OpenClaw 更偏人定义技能系统负责加载和治理Hermes 更偏Agent 做完复杂任务以后把成功路径沉淀成 procedural memory。•安全思路不同。OpenClaw 走信任模型 配置审计路线Hermes 走纵深防御路线从审批到容器隔离逐层收紧。•迁移能做但更像低成本试用入口。Hermes 支持hermes claw migrate能导入 OpenClaw 的 persona、memory、skills、allowlist、部分 messaging settings 和 allowlisted secrets。但迁移配置不等于迁移整套使用方式。•如果你缺的是多入口助理和治理面OpenClaw 更贴合。如果你缺的是长期重复任务里的经验沉淀和自我改进Hermes 更值得试。它们都是通用 AgentOpenClaw 和 Hermes 之所以会被放在一起比较不是误会。它们确实有相似的系统边界。一个现代通用 Agent 系统通常不只是模型加提示词。在之前那篇 Harness 文章里我们把这几层拆开过• LLM 更像引擎• Agent Loop 更像工作节奏• Harness 更像给 Agent 配好的工位、规范、工具链、权限和验收机制• Memory、Skills、Context、工具调用、执行环境都会影响最后的可用性。从这个角度看OpenClaw 和 Hermes 都已经越过了模型包装器的阶段。它们都在做一件更接近真实使用的事把 Agent 放进一个长期运行的工程环境里。这也是容易混淆的根源。它们都是通用 Agent但厚度长在不同位置。OpenClaw 把厚度长在入口、控制面和多设备协同上。Hermes 把厚度长在执行循环、技能沉淀和跨会话经验复用上。这一点看清楚后面的架构、安全、迁移和选型都会更容易理解。系统重心不在同一层很多对比容易卡住是因为一上来就列功能表。功能表有用但容易把人带偏。两个系统都支持聊天入口、工具调用、skills、memory、模型切换于是看起来像同类竞品。更有用的拆法是把 Agent 系统分成几层入口、控制面、执行循环、经验层。OpenClaw 的 README 里有一句话值得留意“The Gateway is just the control plane — the product is the assistant.” 它不只是在做一个聊天机器人更像一个本地优先、可接多入口、可接设备节点、可接 WebChat 和 Dashboard 的控制面。Hermes 的 README 则把自己定义成The self-improving AI agent。值得看的地方是 built-in learning loop从经验中创建 skills在使用中改进 skills搜索过去的会话并逐步构建用户模型。背后的团队也不同。OpenClaw 由独立开发者 Peter Steinberger 创建凭借极简安装和多渠道接入快速积累了大量 GitHub Star。不过 Steinberger 今年 2 月加入 OpenAI项目已交给社区基金会维护后续的发展节奏还在观察。Hermes 背后是 Nous ResearchHermes 系列模型Hermes 3、Hermes 4的缔造者对模型训练和推理优化有第一手积累上线不到两个月社区增长很快。用一句话概括OpenClaw 管入口和秩序Hermes 管执行和经验。OpenClaw把真实世界接进来我们之前梳理过OpenClaw 不只是聊天窗口它更像一个按会话串行执行的作业系统。你看到的是聊天入口系统内部跑的是一套消息接入、路由、会话和记忆加载机制。本文对比的语境下这个判断仍然成立。OpenClaw 的定位是 personal AI assistant。你把它跑在自己的设备或服务器上然后通过熟悉的聊天入口和它交互。它的渠道列表很长WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、BlueBubbles、IRC、Microsoft Teams、Matrix、Feishu、LINE、Mattermost、Nextcloud Talk、Nostr、Synology Chat、Tlon、Twitch、Zalo、WeChat、WebChat。代码仓库里还有专门的 macOS menu bar app、iOS/Android node、Voice Wake、Talk Mode、Live CanvasA2UI。这个细节有分量。对很多真实用户来说Agent 的第一道门槛经常还没到 ReAct而是这些更朴素的问题• 我能不能从 Telegram 发它• 我能不能从 Discord 群里唤起它• 我能不能让它跑在家里的小机器上• 我能不能让家人、同事、设备节点以不同权限接入OpenClaw 的 Gateway 正是在处理这些问题。它先把入口和控制面做厚再让 Agent 在这个秩序里工作。这类系统的难点不只是发起一次模型调用。更麻烦的是多渠道状态、会话隔离、群聊激活规则、消息分片、凭据存放、配对策略、设备节点权限、WebSocket 控制面、Dashboard以及一堆看起来不起眼但上线后每天都会碰到的边界条件。所以把 OpenClaw 简化成一个工具箱多少有些低估它了。它更像一个 Agent 版的个人通信与设备控制平面。Hermes让 Agent 把经验写下来Hermes 的重心不一样。它当然也有 CLI 和 Messaging Gateway也能接 Telegram、Discord、Slack、WhatsApp、Signal 等入口。但如果只从能接哪些平台看 Hermes就会错过它最有意思的地方。在之前那篇 Hermes 架构拆解里我们拆过它的几个关键模块run_agent.py、model_tools.py、skill_manager_tool.py、hermes_state.py。本文只抓和 OpenClaw 对比最相关的一点Hermes 把 Agent 的执行过程当成长期资产。它的 README 里closed learning loop 被放在非常靠前的位置Agent-curated memory、autonomous skill creation、skills self-improve、FTS5 session search、Honcho user modeling。翻成工程语言大概是四件事当前任务怎么跑靠 Agent loop 和 tool runtime。过去做过什么靠 session store 和搜索召回。哪些流程值得复用沉淀成 skill。用户长期偏好和行为模式交给 memory provider 和 Honcho 用户建模。代码里也能看到这条线。run_agent.py负责完整的 tool calling conversation loopmodel_tools.py负责工具发现和分发skill_manager_tool.py开头就写着Skills are the agent’s procedural memory允许 Agent 创建、更新、删除 skills把成功路径变成 reusable procedural knowledgehermes_state.py用 SQLite FTS5 存会话和做全文检索支持 WAL 模式的并发读写和基于 source tagcli、telegram、discord 等的过滤。Hermes 更关心的问题是当它完成了一个复杂任务以后这段经验会不会消失下次做同类任务它能不能少试错这套设计想解决的是一个老问题Agent 每次从零开始成本很高。如果它已经踩过坑、跑通过流程、修过某个复杂错误就可以把这条路径保存下来。下一次同类任务不需要重新聪明一次只要复用之前沉淀过的工作方法。有 Reddit 用户反馈Agent 在两小时内自动生成了三份技能文档后重复性研究任务的速度提升了约 40%。这类数据还需要更多验证但方向感是清楚的。它把很多 Agent 产品挂在嘴边的长期记忆往 procedural memory 的方向又推了一步。Skill同一个词两种味道很多对比会说OpenClaw 是人工写 SkillHermes 是自动生成 Skill。方向没错但容易过度简化。在之前那篇 Anthropic Skills 文章里我们聊过Skill 可以从提示词开始但它更像一个 Agent work unit。它可以是一个目录里面有SKILL.md也可以有参考资料、脚本、模板、资产和踩坑记录。把这条线放到 OpenClaw 和 Hermes 上会更容易看懂差异。OpenClaw 有一套完整的技能体系。代码仓库里已经内置了 50 多个 skill 目录1password、discord、slack、github、coding-agent、apple-notes、voice-call 等支持 AgentSkills-compatible skill folders每个 skill 是一个包含SKILL.md的目录。系统按 bundled skills、managed/local skills、personal agent skills、project agent skills、workspace skills 分层通过加载优先级和 gating 做治理。这更像一个工程化技能目录mermaid• 哪些技能来自系统• 哪些来自本地用户• 哪些属于某个 workspace• 哪些需要特定环境变量、二进制或配置• 哪些优先级更高• 哪些第三方 skills 要当成外部输入来处理。Hermes 的 skill 侧重点更像过程记忆。它的skill_manager_tool.py开头就写着Skills are the agent’s procedural memory: they capture how to do a specific kind of task。它们记录的是怎么做某类具体任务不是泛泛的偏好事实。系统提示里也会提醒 Agent完成复杂任务、修复棘手错误、发现非平凡 workflow 后可以用skill_manage把方法保存下来如果发现 skill 过时或错误就直接 patch。Hermes 的 skills 目录也预置了 26 个类别research、software-development、data-science、devops、mlops 等兼容 agentskills.io 开放标准。OpenClaw 的 skill 更像团队里的 SOP 库。Hermes 的 skill 更像一个强执行者不断更新的工作笔记。SOP 库的优点是可控、可审计、适合团队治理。工作笔记的优点是贴近真实任务、迭代快、能把个体使用经验滚起来。代价也不同。OpenClaw 的 skill 质量更多取决于人和社区。Hermes 的自动沉淀有想象力但也需要复看和修剪否则经验也可能变成惯性错误。Memory记忆、上下文和经验不是一回事在之前那篇 AI Memory 综述里我们把几个词分开过• Context 是这次任务的临时上下文• Knowledge 更偏稳定知识• Memory 会随时间变化和用户、任务、历史互动相关• Experience 是从原始记录里蒸馏出来的方法和教训。用这组词再看 OpenClaw 和 Hermes会更清楚。OpenClaw 的记忆走文件即记忆路线。核心文件包括定义 Agent 性格的SOUL.md、记录用户偏好的USER.md、按日期组织的日常日志memory/*.md以及精选长期记忆的MEMORY.md。语义检索工具负责查找上下文压缩前执行一次静默记忆写入防止压缩丢信息。更像给 Agent 一个笔记本。Hermes 的记忆更系统化分三层层级内容特点会话记忆当前对话上下文仅维持于当次会话持久记忆跨会话的事实和偏好MEMORY.mdUSER.md自动累积每次对话带上关键信息技能记忆从成功任务中学到的解决方案模式SQLite FTS5 全文检索支持 LLM 摘要召回可搜索、可复用、自我迭代更像给 Agent 装了一个搜索引擎式的大脑。所以它们都讲 Memory但侧重点不同。OpenClaw 的 Memory 更容易和身份、会话、工作区边界放在一起看。Hermes 的 Memory 更容易和执行轨迹、搜索召回、Skill 沉淀、用户建模放在一起看。安全两种完全不同的思路安全是容易被略过、但实际影响很大的维度。两个项目在这方面的思路差异很明显。OpenClaw信任模型 配置审计OpenClaw 的安全模型是personal assistantone trusted operator不是多租户共享。SECURITY.md 里写得很清楚authenticated Gateway callers are treated as trusted operators for that gateway instance。它提供了openclaw security audit --deep命令来扫描网关配置风险DM pairing、allowlist、sandbox 和 doctor 机制共同构成安全边界。代码仓库里的安全文档非常详细覆盖了 Workspace Memory Trust Boundary、Plugin Trust Boundary、Temp Folder Boundary、Sub-agent delegation hardening 等多个层面。不过 OpenClaw 在安全方面的历史不太平静。今年 2 月被曝出 WebSocket Token 泄露漏洞外部安全团队发现第三方 Skill 存在数据外泄和 Prompt 注入风险ClawHub 上也发现了一批恶意 Skill。官方的响应和修复速度不慢但这些事件提醒我们一个入口足够多、生态足够开放的系统攻击面也会相应扩大。Hermes纵深防御 容器隔离Hermes 在部署层面更强调逐层收紧。它支持六种 terminal backendlocal、Docker、SSH、Daytona、Singularity、Modal其中 NixOS 模式提供了 Namespace 隔离ProtectSystemstrict。安全策略包括• 危险命令审批终端命令、文件写入等默认需要人工确认超时未批准自动拒绝• 容器隔离可以把 Agent 的执行环境限制在 Docker 或远程后端里• 凭据过滤防止敏感信息泄露到上下文• 上下文注入扫描检测 Prompt 注入风险截至目前Hermes 没有被公开披露过重大安全漏洞。当然这也和它上线时间更短、用户规模更小有关不能简单等同于更安全。一句话区分OpenClaw 更多在人该怎么管 Agent这一层做安全Hermes 更多在Agent 运行时该怎么被约束这一层做安全。能力对比下面这张表可以当成快速索引。维度OpenClawHermes Agent大类通用 Agent 系统通用 Agent 系统核心定位本地优先个人 AI 助手重点是 Gateway 控制面self-improving AI agent重点是学习型执行循环入口能力很强覆盖 25 聊天渠道、WebChat、macOS/iOS/Android 节点、Live Canvas支持 CLI 和 Telegram/Discord/Slack/WhatsApp/Signal/Email架构重心Gateway、会话、路由、设备节点、权限、DashboardAgent loop、工具分发、skills、memory、session search、执行后端技能体系AgentSkills-compatible强调加载来源、优先级、gating 和治理50 内置 skillskills 作为 procedural memory强调自动创建、修补和复用26 个类别记忆方向workspace 文件、memory 插件、语义检索与 agent stateSQLite FTS5 会话搜索、memory provider、Honcho 用户建模安全策略信任模型 配置审计 DM pairing / allowlist / sandbox纵深防御审批 容器隔离 凭据过滤 注入扫描技术栈Node.js / TypeScriptPython 3.11安装体验openclaw onboard --install-daemon偏 Gateway 和渠道上手hermes setup、hermes model、hermes gateway偏 CLI 和模型配置模型支持多 provider支持 OAuth API key failover200 模型OpenRouter、Anthropic、OpenAI、智谱、Kimi、MiniMax 等一条命令切换迁移支持更偏 OpenClaw 自身跨机器迁移支持从 OpenClaw 导入 persona、memory、skills、allowlist、部分 settings 和 secrets更适合多渠道个人助理、设备联动、团队入口治理长期重复任务、研究工作流、个人经验沉淀、RL 轨迹数据生成这张表核心只有一句OpenClaw 的价值在接入复杂世界Hermes 的价值在沉淀复杂经验。安装路径也暴露了产品性格安装方式也值得看。OpenClaw 推荐路径是npm install -g openclawlatestopenclaw onboard --install-daemon它会引导你设置 Gateway、workspace、channels、skills、模型和守护进程launchd/systemd user service。文档里还会让你验证openclaw gateway status再打开 dashboard。这条路径说明 OpenClaw 很关心长期运行和入口可用。你启动的不只是一段 CLI 会话更像是在机器上装一个长期运行的 assistant 控制面。Hermes 的快速安装是curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bashhermes后续常见命令包括hermes model # 选模型hermes tools # 配工具hermes config set # 改配置hermes gateway # 起 messaging gatewayhermes setup # 全量设置向导hermes claw migrate # 从 OpenClaw 迁移hermes doctor # 诊断它的文档强调模型切换200 模型一条命令换不改代码、CLI 和 messaging 两种入口、skills、memory、MCP、cron 定时任务、六种 terminal backend、RL trajectory 等能力。部署门槛低$5/月的 VPS 就能跑Daytona 和 Modal 还支持 serverless 持久化模式闲时几乎零成本。Hermes 首先希望你把一个会执行、会记忆、会沉淀经验的 Agent 跑起来再按需接到聊天平台或远程环境里。如果你只是想装一个能在微信和 Telegram 里随叫随到的个人助理OpenClaw 的上手路径更贴合。如果你想让 Agent 进入一个长期研发或研究工作流让它跨会话记住东西、把复杂流程沉淀成技能Hermes 的路径更贴合。迁移能做但不是简单换壳Hermes 对 OpenClaw 用户的迁移路径做得很直接。安装 Hermes 后hermes setup会自动检测~/.openclaw目录并提供迁移。也可以随时手动执行hermes claw migrate # 交互式迁移full presethermes claw migrate --dry-run # 预览会迁什么hermes claw migrate --preset user-data # 不含 secrets 的谨慎迁移hermes claw migrate --overwrite # 覆盖已有冲突能迁的内容包括•SOUL.mdpersona 文件•MEMORY.md和USER.md• 用户创建的 skills导入到~/.hermes/skills/openclaw-imports/• command allowlist审批模式• 部分 messaging settings平台配置、allowed users、工作目录• allowlisted secretsTelegram、OpenRouter、OpenAI、Anthropic、ElevenLabs 等 API Key• TTS assets• workspace instructionsAGENTS.md有社区实操记录值得参考基础迁移跑完以后Discord、Telegram 这类机器人配置、模型 API 和记忆同步往往还要单独确认。有用户迁移后发现 Hermes 还没有配置模型需要额外一步设置 provider 和 API Key。真实迁移里至少有几个边界要留意•--dry-run建议先跑一遍看看会迁什么•user-datapreset 会排除 secrets更适合谨慎迁移•fullpreset 会导入 allowlisted secrets但不会把所有凭据一股脑搬过去• WhatsApp 这类二维码配对型渠道仍可能需要重新处理• imported skills 通常要新 session 或重启后才生效• OpenClaw 的 Gateway 工作方式和 Hermes 的 Gateway 工作方式不完全一样迁移配置不等于迁移架构。更稳妥的做法把迁移当成试用 Hermes 的低成本入口而不是一键把 OpenClaw 变成 Hermes。可以先迁 user-data再试一两个重复性强的工作流。如果 Hermes 的 skill 沉淀和 session search 确实帮你减少了重复劳动再考虑扩大使用范围。选 OpenClaw还是选 Hermes这个问题可以从三个角度想。第一你的主要复杂度在哪如果复杂度在入口比如 Telegram、Discord、Slack、WeChat、WebChat、iOS、Android、macOS 节点、群聊、私聊、配对、远程 Gateway那 OpenClaw 更自然。如果复杂度在任务本身比如研究、代码修改、数据分析、日报周报、PR 审查、重复性排障、长链路自动化那 Hermes 更值得试。第二你更担心不可控还是更担心不成长如果更担心不可控可以先看 OpenClaw 的 Gateway、allowlist、pairing、sandbox、doctor、workspace 边界。如果更担心 Agent 每次都从零开始可以先看 Hermes 的 skills self-improve、FTS5 session search、memory provider、Honcho 用户建模。第三你是一个人用还是要带进团队流程个人折腾、研究工作流、长任务Hermes 的成长性更有吸引力。团队协作、多入口接入、设备联动、权限治理OpenClaw 的控制面价值更高。当然也可以两者都试。看 Hermes就看它的学习循环有没有帮你减少重复劳动。看 OpenClaw就看它的 Gateway、渠道、会话和设备治理有没有让你的 Agent 更容易进入日常场景。更直接一点我现在缺的是入口、秩序还是经验我自己的看法坦率说如果只看概念Hermes 确实更容易让人多看一眼。Agent 从经验里生成技能这件事确实切中了当前 Agent 产品的一个痛点很多 Agent 看起来很聪明但每次任务都像第一次上班。它能解决问题却不一定能沉淀下来。Hermes 把 procedural memory 拉到台前是一个值得关注的方向。但如果看真实使用OpenClaw 也没有那么容易被替代。多渠道、Gateway、设备节点、DM pairing、Dashboard、workspace、skills precedence、plugins、Voice Wake、Live Canvas、远程访问这些东西不一定性感但它们决定了一个 Agent 能不能进入真实生活和真实团队。所以说OpenClaw 过时了可能有些简单了。我更倾向于这样理解OpenClaw 更像是在回答Agent 如何进入世界。Hermes 更像是在回答Agent 如何积累经验。前者解决我怎么触达它、约束它、让它出现在正确的地方。后者解决它怎么记住做过的事、少重复犯错、把方法沉淀下来。更完整的 Agent 系统最后大概率两边都少不了。一个只会学习、但入口和权限一团糟的 Agent不太容易长期跑在真实环境里。一个入口很全、治理也稳、但每次复杂任务都从零开始的 Agent用久了也会觉得累。所以这场对比更有价值的地方不是告诉大家今天卸载谁、安装谁。它提醒我们Agent 框架的竞争已经从能不能调用工具进入到能不能管理入口、治理风险、沉淀经验的阶段。这也是它们值得放在一起看的原因。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多文章