2026 年上半年 3 大热门 AI 桌面智能体:Codex vs Hermes vs WorkBuddy 深度横评

原创 发布日期:
63

Codex vs Hermes vs WorkBuddy

一、开局:三条路,三种哲学

2026年的AI智能体市场,已经不是"谁更聪明"的比拼,而是"谁更懂你要什么"的较量。

OpenAI的Codex、Nous Research的Hermes Agent、腾讯的WorkBuddy——三款产品,两个国家,三种Agent打法。它们不是简单的功能差异,底层是三套完全不同的架构哲学

维度 Codex Hermes Agent WorkBuddy
核心定位 桌面控制——AI替你操作一切 自进化学习——AI越用越懂你 生态协同——AI调用整个公司帮你干活
一句话概括 AI是你的双手 AI是你的记忆 AI是你的团队
出品方 OpenAI Nous Research 腾讯云CodeBuddy团队
开源状态 Apache 2.0(CLI) MIT(完全开源) 闭源商业软件
上线时间 2026年4月重大升级 2026年2月v0.1.0 2026年3月9日公测

Codex觉得Agent应该像你的双手,替你操作一切;Hermes觉得Agent应该像你的记忆,越来越懂你;WorkBuddy觉得Agent应该像你的团队,调用整个公司的能力帮你干活。

基因不同,终点自然不同。

二、核心能力:各有杀手锏

Codex

2.1 Codex:桌面操控,直接接管你的电脑

2026年4月16日,OpenAI放了一个大招——Codex能"看见"你的电脑屏幕了。移动光标、点击按钮、输入文字,跟你自己操作一样。Figma、Xcode、Slack、浏览器……全都能搞定。

详细介绍https://www.aipuzi.cn/ai-tools/codex.html

这项能力叫"Background Computer Use",技术原理是:

  • 环境感知:Codex定期截取屏幕内容,将截图编码为视觉tokens

  • 意图理解:基于GPT-5.3-Codex理解当前GUI状态

  • 动作规划:决定点击哪个坐标、输入什么文字

  • 执行反馈:执行后再次截图验证,循环直到任务完成

更狠的是多Agent并行——你可以同时让3个、5个甚至更多AI Worker处理不同任务,每个Agent在独立Git Worktree上工作,Agent A重构用户模块,Agent B开发支付模块,并行推进,零代码冲突。

但有个坑:目前仅限macOS,EU/UK还没开放。

Hermes Agent

2.2 Hermes Agent:自我进化,用得越久越聪明

Hermes最狠的地方不是能干什么,而是它会自己变强

详细介绍https://www.aipuzi.cn/ai-news/hermes-agent.html

这套系统叫GEPA(Genetic-Pareto Prompt Evolution),是ICLR 2026 Oral论文级别的学术成果。核心逻辑:

每次成功执行复杂任务后,系统自动复盘,识别重复操作模式,生成结构化技能文件(SKILL.md)存入.skills目录。下次同类请求,直接调用成熟流程,不用重新规划。

这有点像一个程序员把踩过的坑都记在笔记里,而且永远不会忘。它采用四层渐进式记忆架构:短期上下文 → 项目级知识 → 通用技能,层层递进。

2026年5月,Hermes Agent以2710亿tokens登顶OpenRouter全球排行榜,GitHub Stars达189K+,是当之无愧的开源之王。

WorkBuddy

2.3 WorkBuddy:开箱即用,零基础也能上手

WorkBuddy的产品设计砍掉了所有复杂配置,支持单句指令发起任务,模型自动拆解规划并直接输出完整可用成果。

详细介绍https://www.aipuzi.cn/ai-tools/workbuddy.html

实战案例:

  • 整理跨部门零散聊天记录 → 自动拆分会议决议、责任人与截止时间

  • 策划活动方案,给出预算和目标人群 → 直接产出两套可修改的完整执行方案

  • 把零散选题思路粘贴进去,一句指令 → 梳理出完整推文大纲,自动适配公众号、小红书两种排版

据《中国办公智能体平台市场研发报告2026》显示,2026年3月WorkBuddy月访问量达885万,是第二名的两倍多,环比增速831%。按DAU计,已是国内最受欢迎的效率智能体工具。

它还有个独门绝技——微信直连。出门在外打开微信小程序说一句话,回家电脑上材料已经改好,内部叫"流动的上下文"。

三、架构与技术:三种路线的底层逻辑

对比维度 Codex Hermes Agent WorkBuddy
整体架构 三层架构:用户交互层/Agent编排层/执行引擎层 Python单核心智能体 + 抽象消息协议层 桌面客户端 + 腾讯生态原生嵌入
默认模型 GPT-5.4 / GPT-5.3-Codex 自选(200+模型可选) 混元 / DeepSeek / Hy3等5款
模型自由度 仅OpenAI 200+模型可选,支持vLLM完全本地 5大模型切换,不支持本地部署
记忆系统 Memory预览(记住偏好,偏"记住"而非"学习") 四层渐进式记忆 + FTS5全文检索 memory.md + soul.md + user.md
技能沉淀 基础Skills机制 GEPA自动生成SKILL.md,算法驱动进化 20+预置技能包,支持零代码创建
进化能力 较弱,偏"记住偏好"真正的算法级自进化,ICLR 2026 Oral 规则驱动的伪进化(30句复盘+技能沉淀)
上下文窗口 最高40万token,可读整个中型代码仓库 超大上下文,支持跨会话持久记忆 未明确公开,但支持长文档处理

一句话总结技术路线

  • Codex是"云端大脑+本地双手"——大脑在云端,手在你电脑上

  • Hermes是"本地大脑+进化记忆"——全部本地运行,越用越强

  • WorkBuddy是"云端大脑+腾讯身躯"——大脑在腾讯云,身体住在腾讯生态里

四、模型与定价:差距最大的地方

这是三款产品分化最剧烈的维度,直接决定了你的钱包和选择。

维度 Codex 桌面版 Hermes Agent WorkBuddy
默认模型 GPT-5.4 / GPT-5.3-Codex 自选(200+) 混元 / DeepSeek / Hy3
模型自由度 仅OpenAI 200+模型可选 5款切换
本地部署 ✅(vLLM完全本地)
免费额度 ChatGPT Free有限体验 完全免费开源 新用户5000 Credits
付费方案 Plus $20/月, Pro $20/月, Pro $200/月 模型API费用(DeepSeek较便宜) 约800元/月订阅(企业旗舰版198元/人/月)
隐私性 数据出本机需Enterprise/Edu数据完全本地,隐私最强 国内合规服务器加密存储

关键判断

  • 如果你在意隐私、数据不能出本机 → Hermes是唯一选择,它支持vLLM完全本地运行

  • 如果你已有ChatGPT Plus订阅 → Codex性价比最高,直接侧边栏调用

  • 如果你是非技术人员、追求开箱即用 → WorkBuddy新用户5000 Credits够你体验很久

五、部署与易用性:从3小时到3分钟

部署方式 Codex Hermes Agent WorkBuddy
部署方式 CLI命令行(npm全局安装) 交互式向导/一键脚本(5分钟) 图形化安装包,双击即用
硬件要求 普通PC即可 RTX PC / 需GPU(本地部署) 普通办公PC即可
配置复杂度 中等(需配置API密钥) 较高(需理解模型路由等)零配置,零学习成本
数据存储 云端 本地SQLite + 分层记忆 国内合规服务器加密存储
适合人群 ChatGPT用户、轻量编码 开发者、技术团队 非技术人员、办公自动化

实测数据: OpenClaw(与Hermes同类)完整环境搭建通常需数小时,Hermes提供hermes setup交互式向导5分钟内可生成合规config.yaml,WorkBuddy则彻底绕过命令行,全程无需接触任何配置文件

这就是为什么WorkBuddy能在3个月内迭代43个版本、月活冲到885万——它把门槛踩到了地板上

六、生态协同:各自的护城河

生态维度 Codex Hermes Agent WorkBuddy
生态策略 插件商店(90+安全审核插件) 消息平台网关(Telegram/Discord/Slack等)原生居住(腾讯文档/企微/QQ邮箱/微云)
核心插件/技能 GitHub、Slack、Notion、Figma、Linear 70+内建技能 + skillhub 200+技能包 24个专家团、160位AI角色
第三方接入 策略式,每个插件经安全审核 双向接入MCP 深度绑定腾讯全家桶
跨平台能力 仅macOS(桌面操控) 15+消息平台 + 多种部署后端 微信/企微/QQ/飞书/钉钉
独特优势 多Agent并行处理 真正的跨会话持久记忆 微信直连,"流动的上下文"

WorkBuddy的生态是真的有东西。 你在腾讯文档里说一句话,WorkBuddy直接在文档里完成修改,不用下载、上传、切换应用。小程序版上线后,电脑让专家团干活,出门打开微信说一句话,回家材料已经改好。

马化腾在2026年一季度财报会上直接点名:"效率智能体解决方案已初见成效,WorkBuddy目前是中国使用最广的效率智能体服务。"

而Codex的90+插件全部经过安全审核,跟OpenClaw那种3000多个未审核的MCP完全不同——这是策展式生态,质量优先于数量

Hermes则走了另一条路——它不挑平台,哪里有消息它就能接进去,Telegram、Discord、Slack、WhatsApp、Signal、微信、钉钉、飞书全部支持。

七、安全与隐私:不可忽视的维度

安全维度 Codex Hermes Agent WorkBuddy
数据位置 云端(可选本地沙箱) 完全本地 国内合规服务器
本地部署
危险命令 需手动配置 内置危险命令审批模式(强制/智能/关闭) 高危指令拦截
注入防护 基础Prompt注入安全扫描 路径遍历防护+SSRF缓解+凭证管理
零CVE记录 未公开 200+安全补丁,零CVE 腾讯安全体系
企业级管控 需要 自建安全体系 CodeBuddy架构+企业专享版支持VPC私有部署

如果你的数据高度敏感,Hermes是唯一能让数据100%留在本地的选择。 Codex的Enterprise和Edu用户能用Memory预览功能,但目前还只是"记住偏好"而非Hermes那种"AI自己学"的模式。WorkBuddy遵循国内法规,办公数据加密存储于境内服务器,但只有企业专享版才支持VPC私有部署。

八、到底谁适合你?对号入座

你是谁 推荐 理由
全职开发者,需要桌面级编码体验Codex 多Agent并行、云端沙盒、40万token上下文,大型项目重构效率惊人
在乎隐私,数据不能出本机Hermes vLLM完全本地部署,200+模型可选,零数据出本机
在中国,需要办公自动化WorkBuddy 腾讯生态原生居住,微信直连,零学习成本,月活885万验证
"一人公司"创业者WorkBuddy + Hermes组合 WorkBuddy处理办公,Hermes处理技术任务,互补
Agent研究者、追求进化能力Hermes GEPA算法驱动的真正自进化,ICLR 2026 Oral,越用越值钱
非技术岗位员工WorkBuddy 口语化描述需求就能拿成品,十几分钟上手全套用法
高阶开发者,需要极致控制力OpenClaw / Hermes 三级参数体系与插件市场赋予极致控制力
开箱即用型企业WorkBuddy 免部署、强集成、合规无忧,企业旗舰版198元/人/月

九、一张表看清所有差异

维度 Codex Hermes Agent WorkBuddy
架构哲学 超级应用哲学——AI替你操作一切 自举进化哲学——AI越用越懂你 生态嵌入哲学——AI调用整个公司
最强能力 桌面操控 + 多Agent并行 自我进化 + 持久记忆 开箱即用 + 腾讯生态
最大短板 仅限macOS,模型绑定OpenAI 部署复杂,无桌面GUI操控 无真正进化算法,模型锁定5款
月活/流量 周月活500万+ OpenRouter全球第一 月访问量885万,DAU国内第一
定价区间 $20-$200/月 免费开源(自付API费) 新用户5000 Credits,订阅约800元/月
一句话评价 最能打的编程Agent 最有灵魂的开源智能体 最懂中国办公场景的AI同事

十、写在最后

2026年上半年的AI桌面智能体市场,没有全能冠军,只有最合适的工具

Codex用"Background Computer Use"重新定义了什么叫AI操作电脑,多Agent并行让它在编码场景几乎无敌;Hermes用GEPA算法证明了AI可以真正"越用越聪明",2710亿tokens的OpenRouter登顶就是最好的注脚;WorkBuddy则用3个月885万月活、831%环比增速证明了一件事——在中国,最能打的不是最聪明的,而是最懂用户的

选择之前,先问自己一个问题:你要的是一双万能的手、一段越来越长的记忆、还是一个随时待命的团队?

答案清楚了,选择就清楚了。

相关软件下载

Codex(AI 编程智能体)

Codex

软件大小: 464 MB
软件语言: 简体中文
运行平台: Windows,MacOS
打赏
THE END
作者头像
AI铺子
关注ai行业发展,专注ai工具推荐