2026 年上半年 3 大热门 AI 桌面智能体:Codex vs Hermes vs WorkBuddy 深度横评

一、开局:三条路,三种哲学
2026年的AI智能体市场,已经不是"谁更聪明"的比拼,而是"谁更懂你要什么"的较量。
OpenAI的Codex、Nous Research的Hermes Agent、腾讯的WorkBuddy——三款产品,两个国家,三种Agent打法。它们不是简单的功能差异,底层是三套完全不同的架构哲学:
| 维度 | Codex | Hermes Agent | WorkBuddy |
|---|---|---|---|
| 核心定位 | 桌面控制——AI替你操作一切 | 自进化学习——AI越用越懂你 | 生态协同——AI调用整个公司帮你干活 |
| 一句话概括 | AI是你的双手 | AI是你的记忆 | AI是你的团队 |
| 出品方 | OpenAI | Nous Research | 腾讯云CodeBuddy团队 |
| 开源状态 | Apache 2.0(CLI) | MIT(完全开源) | 闭源商业软件 |
| 上线时间 | 2026年4月重大升级 | 2026年2月v0.1.0 | 2026年3月9日公测 |
Codex觉得Agent应该像你的双手,替你操作一切;Hermes觉得Agent应该像你的记忆,越来越懂你;WorkBuddy觉得Agent应该像你的团队,调用整个公司的能力帮你干活。
基因不同,终点自然不同。
二、核心能力:各有杀手锏

2.1 Codex:桌面操控,直接接管你的电脑
2026年4月16日,OpenAI放了一个大招——Codex能"看见"你的电脑屏幕了。移动光标、点击按钮、输入文字,跟你自己操作一样。Figma、Xcode、Slack、浏览器……全都能搞定。
详细介绍:https://www.aipuzi.cn/ai-tools/codex.html
这项能力叫"Background Computer Use",技术原理是:
环境感知:Codex定期截取屏幕内容,将截图编码为视觉tokens
意图理解:基于GPT-5.3-Codex理解当前GUI状态
动作规划:决定点击哪个坐标、输入什么文字
执行反馈:执行后再次截图验证,循环直到任务完成
更狠的是多Agent并行——你可以同时让3个、5个甚至更多AI Worker处理不同任务,每个Agent在独立Git Worktree上工作,Agent A重构用户模块,Agent B开发支付模块,并行推进,零代码冲突。
但有个坑:目前仅限macOS,EU/UK还没开放。

2.2 Hermes Agent:自我进化,用得越久越聪明
Hermes最狠的地方不是能干什么,而是它会自己变强。
详细介绍:https://www.aipuzi.cn/ai-news/hermes-agent.html
这套系统叫GEPA(Genetic-Pareto Prompt Evolution),是ICLR 2026 Oral论文级别的学术成果。核心逻辑:
每次成功执行复杂任务后,系统自动复盘,识别重复操作模式,生成结构化技能文件(SKILL.md)存入.skills目录。下次同类请求,直接调用成熟流程,不用重新规划。
这有点像一个程序员把踩过的坑都记在笔记里,而且永远不会忘。它采用四层渐进式记忆架构:短期上下文 → 项目级知识 → 通用技能,层层递进。
2026年5月,Hermes Agent以2710亿tokens登顶OpenRouter全球排行榜,GitHub Stars达189K+,是当之无愧的开源之王。

2.3 WorkBuddy:开箱即用,零基础也能上手
WorkBuddy的产品设计砍掉了所有复杂配置,支持单句指令发起任务,模型自动拆解规划并直接输出完整可用成果。
详细介绍:https://www.aipuzi.cn/ai-tools/workbuddy.html
实战案例:
整理跨部门零散聊天记录 → 自动拆分会议决议、责任人与截止时间
策划活动方案,给出预算和目标人群 → 直接产出两套可修改的完整执行方案
把零散选题思路粘贴进去,一句指令 → 梳理出完整推文大纲,自动适配公众号、小红书两种排版
据《中国办公智能体平台市场研发报告2026》显示,2026年3月WorkBuddy月访问量达885万,是第二名的两倍多,环比增速831%。按DAU计,已是国内最受欢迎的效率智能体工具。
它还有个独门绝技——微信直连。出门在外打开微信小程序说一句话,回家电脑上材料已经改好,内部叫"流动的上下文"。
三、架构与技术:三种路线的底层逻辑
| 对比维度 | Codex | Hermes Agent | WorkBuddy |
|---|---|---|---|
| 整体架构 | 三层架构:用户交互层/Agent编排层/执行引擎层 | Python单核心智能体 + 抽象消息协议层 | 桌面客户端 + 腾讯生态原生嵌入 |
| 默认模型 | GPT-5.4 / GPT-5.3-Codex | 自选(200+模型可选) | 混元 / DeepSeek / Hy3等5款 |
| 模型自由度 | 仅OpenAI | 200+模型可选,支持vLLM完全本地 | 5大模型切换,不支持本地部署 |
| 记忆系统 | Memory预览(记住偏好,偏"记住"而非"学习") | 四层渐进式记忆 + FTS5全文检索 | memory.md + soul.md + user.md |
| 技能沉淀 | 基础Skills机制 | GEPA自动生成SKILL.md,算法驱动进化 | 20+预置技能包,支持零代码创建 |
| 进化能力 | 较弱,偏"记住偏好" | 真正的算法级自进化,ICLR 2026 Oral | 规则驱动的伪进化(30句复盘+技能沉淀) |
| 上下文窗口 | 最高40万token,可读整个中型代码仓库 | 超大上下文,支持跨会话持久记忆 | 未明确公开,但支持长文档处理 |
一句话总结技术路线:
Codex是"云端大脑+本地双手"——大脑在云端,手在你电脑上
Hermes是"本地大脑+进化记忆"——全部本地运行,越用越强
WorkBuddy是"云端大脑+腾讯身躯"——大脑在腾讯云,身体住在腾讯生态里
四、模型与定价:差距最大的地方
这是三款产品分化最剧烈的维度,直接决定了你的钱包和选择。
| 维度 | Codex 桌面版 | Hermes Agent | WorkBuddy |
|---|---|---|---|
| 默认模型 | GPT-5.4 / GPT-5.3-Codex | 自选(200+) | 混元 / DeepSeek / Hy3 |
| 模型自由度 | 仅OpenAI | 200+模型可选 | 5款切换 |
| 本地部署 | ❌ | ✅(vLLM完全本地) | ❌ |
| 免费额度 | ChatGPT Free有限体验 | 完全免费开源 | 新用户5000 Credits |
| 付费方案 | Plus $20/月, Pro $20/月, Pro $200/月 | 模型API费用(DeepSeek较便宜) | 约800元/月订阅(企业旗舰版198元/人/月) |
| 隐私性 | 数据出本机需Enterprise/Edu | 数据完全本地,隐私最强 | 国内合规服务器加密存储 |
关键判断:
如果你在意隐私、数据不能出本机 → Hermes是唯一选择,它支持vLLM完全本地运行
如果你已有ChatGPT Plus订阅 → Codex性价比最高,直接侧边栏调用
如果你是非技术人员、追求开箱即用 → WorkBuddy新用户5000 Credits够你体验很久
五、部署与易用性:从3小时到3分钟
| 部署方式 | Codex | Hermes Agent | WorkBuddy |
|---|---|---|---|
| 部署方式 | CLI命令行(npm全局安装) | 交互式向导/一键脚本(5分钟) | 图形化安装包,双击即用 |
| 硬件要求 | 普通PC即可 | RTX PC / 需GPU(本地部署) | 普通办公PC即可 |
| 配置复杂度 | 中等(需配置API密钥) | 较高(需理解模型路由等) | 零配置,零学习成本 |
| 数据存储 | 云端 | 本地SQLite + 分层记忆 | 国内合规服务器加密存储 |
| 适合人群 | ChatGPT用户、轻量编码 | 开发者、技术团队 | 非技术人员、办公自动化 |
实测数据: OpenClaw(与Hermes同类)完整环境搭建通常需数小时,Hermes提供hermes setup交互式向导5分钟内可生成合规config.yaml,WorkBuddy则彻底绕过命令行,全程无需接触任何配置文件。
这就是为什么WorkBuddy能在3个月内迭代43个版本、月活冲到885万——它把门槛踩到了地板上。
六、生态协同:各自的护城河
| 生态维度 | Codex | Hermes Agent | WorkBuddy |
|---|---|---|---|
| 生态策略 | 插件商店(90+安全审核插件) | 消息平台网关(Telegram/Discord/Slack等) | 原生居住(腾讯文档/企微/QQ邮箱/微云) |
| 核心插件/技能 | GitHub、Slack、Notion、Figma、Linear | 70+内建技能 + skillhub 200+技能包 | 24个专家团、160位AI角色 |
| 第三方接入 | 策略式,每个插件经安全审核 | 双向接入MCP | 深度绑定腾讯全家桶 |
| 跨平台能力 | 仅macOS(桌面操控) | 15+消息平台 + 多种部署后端 | 微信/企微/QQ/飞书/钉钉 |
| 独特优势 | 多Agent并行处理 | 真正的跨会话持久记忆 | 微信直连,"流动的上下文" |
WorkBuddy的生态是真的有东西。 你在腾讯文档里说一句话,WorkBuddy直接在文档里完成修改,不用下载、上传、切换应用。小程序版上线后,电脑让专家团干活,出门打开微信说一句话,回家材料已经改好。
马化腾在2026年一季度财报会上直接点名:"效率智能体解决方案已初见成效,WorkBuddy目前是中国使用最广的效率智能体服务。"
而Codex的90+插件全部经过安全审核,跟OpenClaw那种3000多个未审核的MCP完全不同——这是策展式生态,质量优先于数量。
Hermes则走了另一条路——它不挑平台,哪里有消息它就能接进去,Telegram、Discord、Slack、WhatsApp、Signal、微信、钉钉、飞书全部支持。
七、安全与隐私:不可忽视的维度
| 安全维度 | Codex | Hermes Agent | WorkBuddy |
|---|---|---|---|
| 数据位置 | 云端(可选本地沙箱) | 完全本地 | 国内合规服务器 |
| 本地部署 | ❌ | ✅ | ❌ |
| 危险命令 | 需手动配置 | 内置危险命令审批模式(强制/智能/关闭) | 高危指令拦截 |
| 注入防护 | 基础 | Prompt注入安全扫描 | 路径遍历防护+SSRF缓解+凭证管理 |
| 零CVE记录 | 未公开 | 200+安全补丁,零CVE | 腾讯安全体系 |
| 企业级管控 | 需要 | 自建安全体系 | CodeBuddy架构+企业专享版支持VPC私有部署 |
如果你的数据高度敏感,Hermes是唯一能让数据100%留在本地的选择。 Codex的Enterprise和Edu用户能用Memory预览功能,但目前还只是"记住偏好"而非Hermes那种"AI自己学"的模式。WorkBuddy遵循国内法规,办公数据加密存储于境内服务器,但只有企业专享版才支持VPC私有部署。
八、到底谁适合你?对号入座
| 你是谁 | 推荐 | 理由 |
|---|---|---|
| 全职开发者,需要桌面级编码体验 | Codex | 多Agent并行、云端沙盒、40万token上下文,大型项目重构效率惊人 |
| 在乎隐私,数据不能出本机 | Hermes | vLLM完全本地部署,200+模型可选,零数据出本机 |
| 在中国,需要办公自动化 | WorkBuddy | 腾讯生态原生居住,微信直连,零学习成本,月活885万验证 |
| "一人公司"创业者 | WorkBuddy + Hermes组合 | WorkBuddy处理办公,Hermes处理技术任务,互补 |
| Agent研究者、追求进化能力 | Hermes | GEPA算法驱动的真正自进化,ICLR 2026 Oral,越用越值钱 |
| 非技术岗位员工 | WorkBuddy | 口语化描述需求就能拿成品,十几分钟上手全套用法 |
| 高阶开发者,需要极致控制力 | OpenClaw / Hermes | 三级参数体系与插件市场赋予极致控制力 |
| 开箱即用型企业 | WorkBuddy | 免部署、强集成、合规无忧,企业旗舰版198元/人/月 |
九、一张表看清所有差异
| 维度 | Codex | Hermes Agent | WorkBuddy |
|---|---|---|---|
| 架构哲学 | 超级应用哲学——AI替你操作一切 | 自举进化哲学——AI越用越懂你 | 生态嵌入哲学——AI调用整个公司 |
| 最强能力 | 桌面操控 + 多Agent并行 | 自我进化 + 持久记忆 | 开箱即用 + 腾讯生态 |
| 最大短板 | 仅限macOS,模型绑定OpenAI | 部署复杂,无桌面GUI操控 | 无真正进化算法,模型锁定5款 |
| 月活/流量 | 周月活500万+ | OpenRouter全球第一 | 月访问量885万,DAU国内第一 |
| 定价区间 | $20-$200/月 | 免费开源(自付API费) | 新用户5000 Credits,订阅约800元/月 |
| 一句话评价 | 最能打的编程Agent | 最有灵魂的开源智能体 | 最懂中国办公场景的AI同事 |
十、写在最后
2026年上半年的AI桌面智能体市场,没有全能冠军,只有最合适的工具。
Codex用"Background Computer Use"重新定义了什么叫AI操作电脑,多Agent并行让它在编码场景几乎无敌;Hermes用GEPA算法证明了AI可以真正"越用越聪明",2710亿tokens的OpenRouter登顶就是最好的注脚;WorkBuddy则用3个月885万月活、831%环比增速证明了一件事——在中国,最能打的不是最聪明的,而是最懂用户的。
选择之前,先问自己一个问题:你要的是一双万能的手、一段越来越长的记忆、还是一个随时待命的团队?
答案清楚了,选择就清楚了。
相关软件下载
Codex
版权及免责申明:本文由@AI铺子原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-tutorial/codex-hermes-workbuddy-comparison.html

