千人排队在腾讯楼下免费安装龙虾

开年爆火的 OpenClaw,让我们一连吃了三个月的"国产龙虾大餐"。

从最先端上的云端版本,到后期号称"原生龙虾体验"的本地小龙虾,别说用户分身乏术,就连每天要追产品测评的我们,都追得眼冒金星。

它们带火的,不仅是一个产品,更是一种想象——“让AI替我打工”。

一众虾之中,到底哪款虾能让我无痛拥有可以媲美 OpenClaw 的体验?光锥智能测评了市面上 10 款小龙虾产品,从一个没有 AI 基础的用户视角出发,看看它们到底能不能扛得起测试"拷打"。

由于有的用户只想尝鲜用虾对付简单工作,有的用户想当"逮虾户"和虾一起向硅基生命的方向进化,针对不同需求,由浅入深地做了套测评:先从最简单的定时日报、搜集信息做起,再进阶到看看这批虾能不能玩转 Skill,带用户完成大佬们同款的复杂任务。

先说结论:大多数虾都能搞定简单任务。但想干点难活,大部分虾都成了"时间杀手",还不保证成功。

安装体验:国产小龙虾把门槛降到了消费级

如果你自己尝试过部署 OpenClaw,且没有开发经验,我敢打赌你肯定浪费过一天以上的人生,否则也不会让千元上门安装 OpenClaw 变成一门生意。

国产小龙虾的贡献,就是把"小龙虾"的门槛从专业级降到了消费级:其中,云端小龙虾目前基本都能做到开箱即用,不需要用户操作,你和云端虾对话就像打开个 AI 模型网址的对话框一样简单。本地龙虾的安装也不难,和正常的电脑应用下载过程一样,只要你会从官网下载安装包,问题不大。

安装相当于起跑线,从配置开始,就是厂商们"八仙过海,各显神通"的时刻。你不想要个冷冰冰的 AI 助手,想让它更像个人。好办,你可以给虾设定好你想要的性格。

我在DuClaw上配置的龙虾性格

比如飞书、阶跃、百度的龙虾,它们都有当下流行的性格配置( Soul.md),可以让你定义龙虾怎么称呼你、用提示词描述你想要的小龙虾"性格",让它交流起来更像真人对话。

我把这批小龙虾的人设全都变成了"靠谱但爱吐槽的同事",于是,阶跃虾会在跑任务时抱怨流程太复杂了,百度会说"放心交给我"。告别了 AI 的冰冷味儿,这种带点脾气的赛博同事,报错时好像也没那么气人了。

简单任务:谁能让用户做"逮虾户"?

以测试 AI 日报任务为例,这是一个定时任务,需要 AI 不仅能够按照你的要求从各大信息源上扒到所需信息并整合成日报,还需要它每天按照固定的时间发给你。

测试结果令人意外:按照"第一次就能准时完成"的标准,直接筛掉了一半产品。

其中,第一次能做到准时发送的,包括智谱、KimiClaw、MiniMax、QClaw,剩下的几个报错理由各异,还要人工陪虾"改作业"。

云端 vs 本地的差异在这里体现得尤为明显。对于没有条件配备专用设备(如 Mac mini)的用户来说,本地龙虾如果关机或者断网,定时任务的执行有可能受到影响。而云端版本可以做到每天稳定推送,不受本地设备状态限制。

进阶玩法:Skill 生态才是核心

为什么网上大佬们的小龙虾那么厉害?今天能做贾维斯,明天又能当理财管家?要解锁想象力,让龙虾办到更多复杂任务,用户是没有耐心打上几百字小作文教 AI 干活的。

互联网上丰富的 Skill 生态,就是小龙虾可以按需安装和拆卸"爪牙"。在开源生态中长起来的 Skill,就来自于每个开发者的贡献。

Skill 的数量和质量,就代表了虾的扩展能力。三种 Skill 基本成了装配的刚需:

  • Creator:让用户能按需创造自己的 Skills
  • Find Skill:免去用户自己上 Skill 网站下载安装,它直接帮你在后台找到你需要的 Skill 并安装
  • Vetter:确保你安装的 Skills 安全,它会对每个需要安装的 Skill 审查一遍,避免带着恶意行为的 Skill 损害你的电脑

复杂任务:配置邮箱花了 3 小时

我们让虾帮忙接上自己的邮箱,整理好未读邮件的内容。配置邮件这个需求看似简单,细究起来全是麻烦事:让 AI 帮我以接邮箱 API 的方式进行,涉及到刷新令牌(Refresh Token)过期的情况,虾们还要帮用户想办法解决。

看起来只需要接个 API 的事情,这十几个龙虾做起来,总共花了 3 个多小时的时间。用户明明想让 AI 帮忙省事,但花在教它们的时间长得让人怀疑人生。

先执行完成的是阶跃星辰的 StepClaw,虽然中间它无数次委婉提示我可以直接手动导入邮箱数据来让它分析(像极了我推活的同事),但在我坚持要求"不要让人类动一下手"后,它自己绕过了获取 Token 的坎,干脆自己写了个可以在网页端运行的脚本来自行读取 Token 给它。

选择"走捷径"的是 QClaw 和百度的 DuClaw、阿里的 JVS Claw,这得益于它们找到的 Skill 用了更简单的方法——push 用户在 Google 上设置个专给应用使用的密码,就能无需获取真正的登录密码信息直接看消息。

比如用下来好用的智谱,一次统计表格的任务就花掉了我 300 积分(智谱赠送的免费额度是 500),相比来说,QClaw 虽然没那么好用,但可能也和内置的模型便宜大碗有关系,毕竟能豪横地送我一天 4000w Tokens 的消耗量。

结论:十只虾,到底谁更好用?

从稳定性、可用性的维度评判:

云端推荐:阿里云的 JVS Claw

在面对一系列问题的时候基本没有报错,在日报任务、邮箱配置等任务上的表现也令人满意。云电脑的设置意味着它能在云端操作一些模拟本地的任务方式。

本地端表现突出:阶跃星辰和智谱

  • 智谱 AutoClaw 稳定性更胜一筹,在搜索信息汇总表格的任务上都做到了第一档体验
  • 阶跃星辰虽然稳定性上表现不佳,但日报、邮件连接任务表现也很出色,它能自己做个网页工具处理任务

中等:KimiClaw、MaxClaw、QClaw、DuClaw

前两个稳定性没问题,只是在任务表现上处于中等水平;后两个不时会出现报错无反馈的情况,但没有出现无法修复的问题。

印象最差:WorkBuddy 和 ArkClaw

基本无法持续使用,正常使用都变成了奢望。

无论哪种形态,稳定性和任务成功率才是决定用户体验的核心指标。再花哨的功能,不如稳定运行一次。

当然,"谁是国内 OpenClaw 平替"的争夺才刚刚掀开帷幕。第一波测评的尾声中,我们又看到了扣子版小龙虾的发布,以及 QClaw V2 版本的大更新等等。在用户吐槽难用、昂贵的当下,小龙虾的迭代还在加速进化。

爆款虾或许就在路上。

来源:腾讯新闻 / 光锥智能
作者:魏琳华