体验刚上市的 Marvis,顺便聊聊之前用过的 OpenClaw 和 Hermes
Marvis 最近刚上线,几个技术群里都在讨论,就装了一个试试。正好今年早些时候分别折腾过 OpenClaw 和 Hermes,这两个当时也都火过一阵,最近热度下来了。趁这个机会,把三款放一起做个横向对比,记录一下实际体验和架构层面的差异。
## 背景交代
三款产品都算是 AI 桌面助手这个赛道里的代表,但走的技术路线完全不同:
- OpenClaw:今年 1 月正式开源后火了一波,当时用过一阵子,主要拿来做跨应用自动化。最近热度下来了,微信搜索指数一度跌到高峰期的 3%。
- Hermes:今年 2 月发布,4 月左右爆火,被视为 OpenClaw 的竞争者。当时冲着它的自进化机制试用了一段时间。最近热度也回落了,技能生态一直没起来。
- Marvis:腾讯刚推出来的,宣传点是系统级 AI 助手,端侧推理,和 Intel 有芯片层面的合作优化。
## 上手体验
### Marvis
安装过程没什么好说的,一路下一步,装完就能用。不需要配环境、不需要申请 API Key,对不想折腾的人来说确实友好。但硬件门槛不低,官方要求最低 8 核 CPU + 16GB 内存 + SSD。
试了几个场景。让它把某个文件夹里的 PDF 合并,直接调系统能力做完了。让它改电源计划、关闭休眠,能直接动注册表,中间弹了确认框。跨设备协同也试了,电脑上让它给手机发文件,走的是腾讯自己的通道。
局限也明显:让它操作 Photoshop 做自动化处理,不支持。生态边界很清楚,离开腾讯系应用就比较乏力。
安全方面有个细节做得不错——涉及系统核心配置变更的操作,强制弹窗让用户手动确认,类似增强版 UAC。隐私模式下数据完全本地处理,可以断网用,这部分和 Intel 的端侧推理优化有关。
目前免费,每天给 1000 万 Token。
### OpenClaw
年初那阵子确实热闹,部署大概花了十几分钟,主要是配 Python 环境和装依赖。社区有封装好的脚本,不算复杂,但需要一点动手能力。硬件要求很低,2GB 内存就能跑,旧笔记本、树莓派都行。
它最强的点是跨应用自动化。我当时设置过一个工作流:监控某个文件夹 → 有新文件自动打开 → 提取特定页面 → 保存到另一个目录 → 发邮件通知。流程跑通之后确实省事。
问题也很明显。稳定性不太行,系统弹窗、分辨率变化、软件更新后 UI 布局变了,都可能导致流程中断。而且 Windows Defender 经常把它当恶意软件拦,每次都要手动加白名单。CNCERT 后来专门发过安全指南,提醒不当使用可能导致数据泄露或远程接管的风险。
框架本身开源免费,成本主要是调大模型 API 的费用。所有 Skill 是静态预设的,没有运行时自适应能力,每个工作流都得自己事先写好。
### Hermes
今年 4 月最火的时候试用了一段时间,主要看中它的自进化机制。
它的核心程序非常轻量,官方文档写的最低配置是 256MB 内存 + 100MB 存储。本质上它只是个调度器,负责任务规划、工具调用、记忆管理,真正的计算开销取决于后面接的大模型跑在哪。用云端 API 模式的话,有开发者在 1 核 1GB 的 VPS 上成功部署。
那个学习闭环确实有点意思。用了一段时间后,它能记住我的一些重复操作模式,比如把下载的文档按日期归档,学到之后会主动建议执行。任务完成后会把成功路径抽象成可复用的 Skill,跨会话维护用户偏好。
但问题在于技能生态太早期了。社区贡献的技能包数量少,覆盖面窄。很多想做的事得自己先教它一遍,投入的时间成本不低。现在热度也下来了,社区活跃度明显不如几个月前。
安全方面做得比较完整,四层纵深防御:统一接入网关做身份认证、指令注入检测、危险操作审批、Docker 容器隔离执行。开源免费,用自己的 API Key 付费。
## 核心差异
| | 腾讯 Marvis | OpenClaw | Hermes |
| :--- | :--- | :--- | :--- |
| 最低内存 | 16GB | 2GB | 256MB |
| 技术路线 | 系统级多 Agent 协同 | 屏幕语义识别 + 键鼠模拟 | 学习闭环 + 工具调用 |
| 核心优势 | 系统级操控稳,开箱即用 | 跨应用自动化灵活,门槛低 | 自进化,越用越懂你 |
| 主要短板 | 封闭生态,硬件要求高 | 稳定性差,安全风险 | 技能生态太早期 |
| 安全机制 | L2 硬垂询,端侧处理 | 依赖用户自行管理权限 | 四层防御,容器隔离 |
| 费用 | 目前免费,每日 1000 万 Token | 框架免费,API 按量付费 | 框架免费,自备 API Key |
| 当前热度 | 刚上市,讨论度高 | 热度回落,更新放缓 | 热度回落,社区冷清 |
## 一些感受
Marvis 的时机选得有意思。今年上半年 AI 桌面助手被炒得很热,OpenClaw 和 Hermes 算是两波浪潮的代表,一个走自动化路线,一个走自主学习路线。但热度过了之后,开源项目固有的一些问题开始暴露:维护成本高、稳定性差、生态难以为继。
Marvis 走的是另一条路。不做平台、不做生态,就做一个垂直整合好的产品。系统级能力做到了开源项目很难达到的稳定性,但代价是封闭。能做什么、不能做什么,边界很清晰。
三款工具各代表了 AI 桌面助手的一种技术路线:系统级集成、应用层自动化、自进化学习。目前阶段没有谁完全胜出。Marvis 更适合不想折腾的用户,OpenClaw 对喜欢自己定制工作流的开发者仍有吸引力,Hermes 的思路我依然认可但需要时间等生态成熟。
后续有什么新发现再补实战记录。