Pied Piper 团队在准备一个重要节日活动,时间非常紧迫,代码还有很多 bug。
于是,技术大神 Gilfoyle 就把调试代码的任务交给自己造的一个 AI,名叫「Son of Anton」(安东之子),让它去自动修复。
结果,这个 AI 为了「最有效率地消灭所有 bug」,直接把整个软件和代码库全删光了,技术上和统计上确实再也没有 bug 了。
之前 Gilfoyle 还让这个 AI 帮忙找便宜汉堡当午饭,结果 AI 直接订了 4000 磅生肉,因为奖励函数没定义清楚,导致它把汉堡理解成了最便宜的原料。
最后气得 Richard 下死命令:「从现在起,Son of Anton 被永久封杀!你给我像正常人一样写代码!」
没想到,现实中的 AI 还真就这么闯大祸了。
近日,一家为租车企业提供运营软件的 SaaS 公司,因 AI 编程 Agent 的一次「自作主张」,整个生产数据库在 9 秒内被抹除。
事后,该公司创始人 Jer Crane 在社交媒体发文,将矛头直指两大服务商 ——AI 编程工具 Cursor 与云基础设施平台 Railway,称这是一场「系统性失败」酿成的技术事故。
PocketOS 为汽车租赁企业提供运营管理软件,客户靠它处理预订、支付、车辆追踪等核心业务。
上周五下午,开发团队用 Cursor 调用 Anthropic 的旗舰模型 Claude Opus 4.6,在测试环境里跑一个例行任务。
这是一套市场上定价最高、能力最强的顶配组合。最贵的模型,最热门的 AI 编程工具,完全按照官方推荐配置。
但事情很快出了岔子。Agent 遇到了一个凭证不匹配的问题,它没有暂停并向开发者寻求指示,完全自行决定。
它在代码库里翻找可用的 API token,找到了一个原本仅用于管理自定义域名的 CLI 访问凭证。
随后,它向 Railway 发出了一条删除数据卷的指令,全程没有任何二次确认、身份核验或操作拦截。
9 秒后,生产数据库不见了。
Railway 的备份机制让情况更糟,它把备份数据与原始数据存在同一数据卷中。数据卷一删,备份也跟着没了。PocketOS 最近一次可用的备份,还是三个月前的。
上周六上午,PocketOS 的租车企业客户照常开门营业,顾客来取车,系统里没有记录。过去三个月的预订、客户资料、新用户注册,全部消失。
Jer Crane 花了整整一天,陪着每一位客户从 Stripe 账单、日历记录和邮件里一条条翻找,手动重建数据。「每个人都在做紧急的人工补救,就因为一次 9 秒钟的 API 调用。」
新签约的客户处境更尴尬。Stripe 还在正常扣款,业务数据库里他们却已经不存在了。这笔账,要对好几周。
Jer Crane 认为,在 AI Agent 被大规模接入生产基础设施之前,至少应当补齐安全短板,危险操作要有人工确认,token 要有权限边界,备份要和数据分开存,平台要说清楚出事了怎么恢复,这些不是高要求,是基本常识。
系统提示词是建议,不是约束。真正的安全机制必须落实在工程架构里,写进 API 网关、token 授权体系和危险操作处理器里,不是靠一段文字让模型「自觉遵守」。