机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 88|回复: 0

大模型AI瞎编程直接干死了亚马逊

[复制链接]

2万

主题

3万

帖子

20万

积分

超级版主

Rank: 8Rank: 8

积分
208484
发表于 昨天 20:32 | 显示全部楼层 |阅读模式
过去几年里,科技公司几乎都在同一件事上加速:让 AI 参与写代码。
从自动补全、自动生成函数,到直接修改系统配置,生成式 AI 已经逐渐走进真实生产环境。但最近发生在亚马逊的一连串事故,却给整个行业泼了一盆冷水——当 AI 开始真正参与生产环境开发时,事情可能远比想象复杂。
最近,多家媒体披露,本周二亚马逊内部紧急召开了一场工程“深度复盘(deep dive)”会议,专门讨论最近频繁出现的系统故障——其中,一个被反复提及的关键词是:AI 辅助代码。

事情的起点,是最近一段时间亚马逊系统稳定性明显下降。
负责亚马逊网站技术架构的高级副总裁 Dave Treadwell 在一封内部邮件中坦言:“各位,正如大家可能已经知道的,最近网站及相关基础设施的可用性确实不太理想。”
为此,公司决定把原本每周例行举行的技术会议 “This Week in Stores Tech”(简称 TWiST) 临时改成一次“深度复盘会议”。通常来说,TWiST 会议对员工是自愿参加的,但这一次,Treadwell 要求工程师尽量全部参加。
这场会议在周二中午 12:30 召开,主要目标只有一个:弄清楚最近这一连串系统故障到底是怎么发生的——Treadwell 在内部邮件中透露,仅仅在一周时间内,公司就发生了 4 起 Sev1 级别事故。
这里解释一下:在亚马逊的事故分级体系中,Sev1 即最高级别事故,通常意味着核心系统宕机或关键功能严重受影响。
也就是说,这已经不是普通的小 Bug,而是直接影响业务运行的大问题。

如果你在3月5号左右的凌晨,打开亚马逊,可能会怀疑自己输错了网址——满屏都是各种小狗图,和巨大的“Sorry”。
这是亚马逊的“招牌”,在网站崩溃的时候,掏出萌萌的小狗图,滑跪道歉,安抚用户。
“大家可能都听说了,最近我们的系统和相关的基础服务,有点不太好。”
这是亚马逊电商基础服务高级副总裁 Dave Treadwell在3月10日发给工程团队的内部邮件开头。当天下午,亚马逊召开了一场紧急的“深度复盘”会议,议题是最近一连串的系统宕机事故。
这些事故指向了同一个地方:AI辅助写出来的程序,突然出 bug了。
这在去年12月时就发生过,亚马逊内部的 AI编程助手 Kiro在修复一个环境问题时,自行决定“删除并重建整个环境”,导致 AWS区域性宕机13小时。一开始亚马逊官方称这是“使用错误,不是 AI错误”。
安全研究员 Jamieson O'Reilly出来反驳说,“至少没有 AI时,人类需要手动输入一整套指令,在这个过程中有更多时间发现自己的错误。”
亚马逊频传当机的消息引起科技专家注意,奥列尼克本周在X发文写道:“亚马逊正针对AI破坏系统召开强制会议。”
马斯克在奥列尼克发文底下回应写道:“谨慎行事。”

根据报导,亚马逊电商服务资深副总监特雷德威尔(Dave Treadwell)在电邮中说,团队每周会议将花时间讨论如何针对工程师使用AI增设防护机制,例如初级工程师、中级工程师使用AI辅助变更时,必须经过资深工程师核准。
换句话说:初级工程师可以用 AI 改代码,但不能直接上线,必须由资深工程师签字确认——某种意义上,这相当于给 AI 生成代码增加了一层“人工安全阀”。
但对于这项新规定,一些分析师也提出了担忧。例如,Constellation Research 首席分析师 Chirag Mehta 就表示:“如果每次 AI 改代码都需要高级工程师去逐行审核,那么企业很可能把 AI 带来的效率优势又还回去了。”
而真正的风险也并不是 AI 会犯错,毕竟人类工程师同样会犯错——真正的问题在于:AI 会把错误放大。正如 Info-Tech Research Group 的研究总监 Manish Jain 所说,AI 最大的危险是它压缩了人类干预和纠正问题的时间。

亚马逊发言人对财星杂志(Fortune)发表声明说,“本周商店技术”(This Week in Stores Tech)是零售科技团队与主管之间每周举行的例行会议,旨在检讨营运表现;网站及应用程序检讨属于正常业务的一部分,“亚马逊网络服务”(Amazon Web Services)并未发生当机事故,会中讨论的事件只有一起跟AI有关,但没有事件是与AI编程有关。

但事实上,据《金融时报》报道,在此次会议的准备材料中,亚马逊的一份内部文档曾提到:过去几个季度,公司出现了一种“事故趋势”,其中一个因素就是“GenAI 工具辅助的代码变更”。
这份文档还指出了一个关键问题:一些新的生成式 AI 使用方式,目前还没有成熟的工程规范和安全防护机制。
不过,根据 CNBC 获得的更新版本文件显示,在亚马逊内部会议开始前,涉及 GenAI 的那一条内容被删除了——知情人士表示,该调整可能与内部信息敏感性有关。

奥列尼克接受财星杂志访问时说,亚马逊的AI助手“Q”虽然可以加速编码过程,风险却是编写、审核、部署过程可能破坏系统,平台容易出现当机。他说,并不是反对部署AI,而是不应该追求速度而使用AI,也不要为了使用AI而用AI。
LexisNexis Risk Solutions 的 CISO Flavio Villanustre 给出了一个很形象的比喻:“AI 就像一个非常聪明但没有安全意识的孩子。”在 AI Agent 技术出现之后,软件开发速度已经大幅提升,企业的治理体系却没有同步升级,AI 策略还过于激进。
如果企业直接让这样的系统操作关键基础设施,结果就是:小 Bug 可能瞬间影响大规模系统、修复时间窗口变得更短、事故影响范围更大——因此,虽然“人类审核”会降低效率,但目前看来,这仍是必要的安全措施。




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2026-3-15 14:41 , Processed in 0.078125 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表