寂静回声 发表于 昨天 16:21

大模型代理‘龙虾“现在就是把人骗进来杀

OpenClaw 这类产品真正有价值的地方,本来就是能碰你本地环境,帮你做本地程序和本地文件那一层的动作。如果跑在云端,它很多时候碰不到你真实的本地上下文。
有人购买了kimi大模型的云上"龙虾"服务,200大洋。买的时候没把上面的逻辑想透,买完每天都在“龙虾”教育。

第一个打脸点是文件发送。
刚开始网页版kimi大模型不支持发文件,只能走飞书。然后飞书链路不稳定,它那边一直说“已发送”,这位仁兄这边一直没收到。让它重发,它继续说发了,结果还是空气。这个环节不是卡一会儿,是直接耗掉两三天。
后来网页版kimi大模型终于支持文件发送,这位仁兄本来以为能往前走了,结果依然会出现“它说发了,我没收到”。
这种体验最烦的地方是,你连排障起点都抓不住,它的提示和你的现实完全是两套世界。



第二个打脸点是网页登录。
这位仁兄买之前压根没把这层想进去,结果让它去 Boss 直聘,页面能开,后面直接风控,严重时候连登录都做不到。
小红书也一样,在云端环境里直接被封控。
很多人以为“让 agent 上网办事”是个顺滑动作,实际第一步就可能被站点策略掐死。
你在对话框里看到的是“正在执行”,屏幕上看到的是“请验证身份”或者“访问异常”。



第三是对话记忆丢失问题
至少遇到三次,第一次是买来后的第二天,官方侧就出现过问题。
第二次是没过几天重启之后,聊天记录又不见了。
它又不是那种可以随便新开会话分项目管理的形态,很多内容都压在一条连续对话里,这条线断了,前面的大量上下文也跟着断。
最近这次这位仁兄问它“昨天我们聊啥了记得不”。它先回“让我查一下昨天的记录”,然后给了一句离谱的话: memory_search 和昨天的文件都不存在,说明昨天没有对话记录……所以答案是:昨天没聊,我刚醒。

问题是昨天明明让它做了很多调研,一块是怎么让 Claude Code 和 CodeX 这种平台里的主 Agent 去调动子 Agent 交付结果,另一块是能不能一个任务调动两个平台协作,往更自动化的方向走。今天本来想让它接着昨天的线继续,结果它直接把线抹掉了。你在这种地方断一次,前面投入的时间就像被按了清空。

后来这位仁兄受够了,改用最初的openClaw了。

本体部署不难,十分钟差不多就起来。真正吃时间的是后面那一串:权限、skills、模型配置、任务失败重跑。
而且它的状态不是一直稳定上升,最开始的时候它连回答都回答不了,后面终于能回了,很多结果还是错的。你会有一种很强的反差,表面上像是“终于通了”,实际只是从“完全不可用”变成“看起来可用但交付错误”。


开始他用 MacBook Pro 跑,跑着跑着发现它要的权限越来越多,就赶紧切到家里的 Mac Mini 继续折腾剩下的工作。
macOS 这一套大家都懂,它默认就不想你随便给程序高权限。屏幕录制、输入输出、摄像头音频、完全磁盘访问、辅助功能、自动化,这些一个都不能少。最恶心的是辅助功能和自动化,不是你点一下就能把目标加进去,经常要绕来绕去。每天都在猜:这一步到底该加 OpenClaw、Terminal 还是 Nodejs?你以为你在做自动化,实际你在玩权限猜谜。

更离谱的是有些权限根本不能靠脚本改,也不能指望 terminal 一把梭。很多动作必须人手点。你想走工程化,系统告诉你这一步只能手工。即使有 Claude Code 和 CodeX 帮助,很多限制还是得你自己盯着系统设置一项项点。


跑起来以后也不代表能交付。
给过它最原始的指令:打开 QQ,给某个人发一条消息。结果它把 QQ 打开了,然后就愣住。真的就是停在那儿,没有后续。
又给一条:打开 Codex,新建一个对话,做一个 AI 调研。它折腾了很久,在键盘上乱点,前面倒是成功新建了一个对话,后面就是输不进去内容。你看它在那儿忙半天,结果卡在最基础的输入动作上。
中间还有一次执行现场特别荒诞。它先开一个 Chrome 调试窗口,又开第二个;它开第三个;然后关一个再开一个,再关一个再开一个。五六个窗口来回弹,最后在某个窗口里停住不动。过一会儿它回你一句“我已经完成了”。你当时真的会怀疑,是看错了还是它理解错了“完成”这两个字。
Boss 直聘筛岗那次也是同样的风格。它进去后就是刷,刷,继续刷,最后触发风控,任务终止。这个过程看着像“差一点就成功”,实际上从中段就偏航了,只是你要等很久才拿到那个失败结果。


他还用过CoPaw,是阿里 AgentScope 团队二月底推的,首个指令就做成了一个 OpenClaw 折腾几天都没做完的动作。
结果继续用就撞到另一个坑:上下文很容易打满,一旦重开对话,连续性就断。你想让它顺着昨天做,等于从头再来。


Kimi云上“龙是”是固定成本,199 一个月。
OpenClaw 和 CoPaw 是试错成本,前后又烧了七八十 token。七八十看着不大,问题是它只买到了“继续重试”。
真正贵的是时间和注意力。这位仁兄那段时间几乎是每天下班就进这个坑,先处理权限,再看执行,再复盘失败,再重跑。
不是在用工具提效,你是在给半成品做陪跑。
而且这七八十不是一次性爆掉,是一点点被磨掉的。你会不断跟自己说“再给它一次机会”,每次都觉得可能就差这一项配置,可能就差这一次刷新,可能就差这轮重试。等你回头看账单,才发现自己不是在推进任务,是在给失败过程续费。
情绪变化也很标准。刚买的时候当然兴奋,花了钱就想看结果。前面几个问题跑不通,是不是指令写得不对,是不是对 OpenClaw 还不够熟。然后你继续调,继续等,继续看它乱点和报“已完成”。兴奋慢慢就没了,到后面只剩下“我不想再把晚上搭进去了”


你要是就喜欢折腾,把调权限、调模型、调 skills 当乐趣,那这堆“龙虾”确实有搞头。
问题是普通人不是冲“研究乐趣”买单,是冲“把活干完”买单。按这个标准,目前看到的投入产出比不到十分之一。


如果回到 CodeX 和 Claude Code,这位仁兄的体验感 反而更踏实。因为除了“直接替我控制电脑去点网页”这类动作做不到,其他事情基本都能落地。它们也会失败,但失败更可预测,你知道下一步要补什么,不会一直困在窗口连环弹出和无限刷新里。
所以这位仁兄在公号上写下上述文字就是在抨击,不绕弯。抨击的不是某一个产品某一次故障,抨击的是这套叙事:
先把人带进“你马上就有全能助手”的想象,再把真实门槛藏在权限、风控、连续性这些不会写在首页的细节里。
https://s3.bmp.ovh/2026/03/14/mYleb0Cx.jpg

https://s3.bmp.ovh/2026/03/14/09xdGxjA.jpg











2266998 发表于 昨天 16:30

好几天都说“虾吃人”,许多人在哭诉,
页: [1]
查看完整版本: 大模型代理‘龙虾“现在就是把人骗进来杀