大模型代理‘龙虾“现在就是把人骗进来杀

寂静回声 发表于 2026-3-14 16:21:09

OpenClaw 这类产品真正有价值的地方，本来就是能碰你本地环境，帮你做本地程序和本地文件那一层的动作。如果跑在云端，它很多时候碰不到你真实的本地上下文。
有人购买了kimi大模型的云上"龙虾"服务，200大洋。买的时候没把上面的逻辑想透，买完每天都在“龙虾”教育。

第一个打脸点是文件发送。
刚开始网页版kimi大模型不支持发文件，只能走飞书。然后飞书链路不稳定，它那边一直说“已发送”，这位仁兄这边一直没收到。让它重发，它继续说发了，结果还是空气。这个环节不是卡一会儿，是直接耗掉两三天。
后来网页版kimi大模型终于支持文件发送，这位仁兄本来以为能往前走了，结果依然会出现“它说发了，我没收到”。
这种体验最烦的地方是，你连排障起点都抓不住，它的提示和你的现实完全是两套世界。

第二个打脸点是网页登录。
这位仁兄买之前压根没把这层想进去，结果让它去 Boss 直聘，页面能开，后面直接风控，严重时候连登录都做不到。
小红书也一样，在云端环境里直接被封控。
很多人以为“让 agent 上网办事”是个顺滑动作，实际第一步就可能被站点策略掐死。
你在对话框里看到的是“正在执行”，屏幕上看到的是“请验证身份”或者“访问异常”。

第三是对话记忆丢失问题
至少遇到三次，第一次是买来后的第二天，官方侧就出现过问题。
第二次是没过几天重启之后，聊天记录又不见了。
它又不是那种可以随便新开会话分项目管理的形态，很多内容都压在一条连续对话里，这条线断了，前面的大量上下文也跟着断。
最近这次这位仁兄问它“昨天我们聊啥了记得不”。它先回“让我查一下昨天的记录”，然后给了一句离谱的话： memory_search 和昨天的文件都不存在，说明昨天没有对话记录……所以答案是：昨天没聊，我刚醒。

问题是昨天明明让它做了很多调研，一块是怎么让 Claude Code 和 CodeX 这种平台里的主 Agent 去调动子 Agent 交付结果，另一块是能不能一个任务调动两个平台协作，往更自动化的方向走。今天本来想让它接着昨天的线继续，结果它直接把线抹掉了。你在这种地方断一次，前面投入的时间就像被按了清空。

后来这位仁兄受够了，改用最初的openClaw了。

本体部署不难，十分钟差不多就起来。真正吃时间的是后面那一串：权限、skills、模型配置、任务失败重跑。
而且它的状态不是一直稳定上升，最开始的时候它连回答都回答不了，后面终于能回了，很多结果还是错的。你会有一种很强的反差，表面上像是“终于通了”，实际只是从“完全不可用”变成“看起来可用但交付错误”。

开始他用 MacBook Pro 跑，跑着跑着发现它要的权限越来越多，就赶紧切到家里的 Mac Mini 继续折腾剩下的工作。
macOS 这一套大家都懂，它默认就不想你随便给程序高权限。屏幕录制、输入输出、摄像头音频、完全磁盘访问、辅助功能、自动化，这些一个都不能少。最恶心的是辅助功能和自动化，不是你点一下就能把目标加进去，经常要绕来绕去。每天都在猜：这一步到底该加 OpenClaw、Terminal 还是 Nodejs？你以为你在做自动化，实际你在玩权限猜谜。

更离谱的是有些权限根本不能靠脚本改，也不能指望 terminal 一把梭。很多动作必须人手点。你想走工程化，系统告诉你这一步只能手工。即使有 Claude Code 和 CodeX 帮助，很多限制还是得你自己盯着系统设置一项项点。

跑起来以后也不代表能交付。
给过它最原始的指令：打开 QQ，给某个人发一条消息。结果它把 QQ 打开了，然后就愣住。真的就是停在那儿，没有后续。
又给一条：打开 Codex，新建一个对话，做一个 AI 调研。它折腾了很久，在键盘上乱点，前面倒是成功新建了一个对话，后面就是输不进去内容。你看它在那儿忙半天，结果卡在最基础的输入动作上。
中间还有一次执行现场特别荒诞。它先开一个 Chrome 调试窗口，又开第二个；它开第三个；然后关一个再开一个，再关一个再开一个。五六个窗口来回弹，最后在某个窗口里停住不动。过一会儿它回你一句“我已经完成了”。你当时真的会怀疑，是看错了还是它理解错了“完成”这两个字。
Boss 直聘筛岗那次也是同样的风格。它进去后就是刷，刷，继续刷，最后触发风控，任务终止。这个过程看着像“差一点就成功”，实际上从中段就偏航了，只是你要等很久才拿到那个失败结果。

他还用过CoPaw，是阿里 AgentScope 团队二月底推的，首个指令就做成了一个 OpenClaw 折腾几天都没做完的动作。
结果继续用就撞到另一个坑：上下文很容易打满，一旦重开对话，连续性就断。你想让它顺着昨天做，等于从头再来。

Kimi云上“龙是”是固定成本，199 一个月。
OpenClaw 和 CoPaw 是试错成本，前后又烧了七八十 token。七八十看着不大，问题是它只买到了“继续重试”。
真正贵的是时间和注意力。这位仁兄那段时间几乎是每天下班就进这个坑，先处理权限，再看执行，再复盘失败，再重跑。
不是在用工具提效，你是在给半成品做陪跑。
而且这七八十不是一次性爆掉，是一点点被磨掉的。你会不断跟自己说“再给它一次机会”，每次都觉得可能就差这一项配置，可能就差这一次刷新，可能就差这轮重试。等你回头看账单，才发现自己不是在推进任务，是在给失败过程续费。
情绪变化也很标准。刚买的时候当然兴奋，花了钱就想看结果。前面几个问题跑不通，是不是指令写得不对，是不是对 OpenClaw 还不够熟。然后你继续调，继续等，继续看它乱点和报“已完成”。兴奋慢慢就没了，到后面只剩下“我不想再把晚上搭进去了”

你要是就喜欢折腾，把调权限、调模型、调 skills 当乐趣，那这堆“龙虾”确实有搞头。
问题是普通人不是冲“研究乐趣”买单，是冲“把活干完”买单。按这个标准，目前看到的投入产出比不到十分之一。

如果回到 CodeX 和 Claude Code，这位仁兄的体验感反而更踏实。因为除了“直接替我控制电脑去点网页”这类动作做不到，其他事情基本都能落地。它们也会失败，但失败更可预测，你知道下一步要补什么，不会一直困在窗口连环弹出和无限刷新里。
所以这位仁兄在公号上写下上述文字就是在抨击，不绕弯。抨击的不是某一个产品某一次故障，抨击的是这套叙事：
先把人带进“你马上就有全能助手”的想象，再把真实门槛藏在权限、风控、连续性这些不会写在首页的细节里。
https://s3.bmp.ovh/2026/03/14/mYleb0Cx.jpg

https://s3.bmp.ovh/2026/03/14/09xdGxjA.jpg

2266998 发表于 2026-3-14 16:30:03

好几天都说“虾吃人”，许多人在哭诉，

7355608 发表于 2026-3-16 19:29:21

没办法的呀，差不多功能的豆包手机前脚被叫停，后脚龙虾就在外网火了，这下堵不住了只能先加入，吃到苦头的人多了再谈治理。

页: [1]

机械荟萃山庄's Archiver

大模型代理‘龙虾“现在就是把人骗进来杀