机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 78|回复: 0

对AI的过分迷信导致AWS史诗级宕机

[复制链接]

2万

主题

2万

帖子

19万

积分

超级版主

Rank: 8Rank: 8

积分
195346
发表于 12 小时前 | 显示全部楼层 |阅读模式
AWS 这两天发生了又一次宕机事故,定级铁 P0,一点问题没有,影响很广,一大波代金券(Service Credit)要遭殃了。


AWS 在其 US-EAST-1 服务中,于 2025 年 10 月 20 日凌晨开始,发现“多个服务错误率和延迟上升”。
约 1 小时后,AWS 确认其 DynamoDB 端点在 US-EAST-1 区域出现“显著错误率”。
最终,AWS 将故障根因定位为 “DynamoDB API 端点在 US-EAST-1 区域的 DNS 解析问题”——也就是 DNS 解析失败/中断导致级联故障。
DynamoDB 是 AWS 的基础服务之一,很多其他服务在其之上运行,因此它的问题导致了一连串的广泛影响。



国外一位老哥,The Register 的专栏作者 Corey Quinn,给出的结论是《Today is when the Amazon brain drain finally sent AWS down the spout》,骂得真脏,说人家脑子干了。括弧,此处脑子其实是指 AWS 内部的高级人才。
作者提出了一个比较隐蔽但严重的问题:AWS 的资深工程师、具备多年在大规模云环境中形成的机构知识(institutional knowledge)人员,在近年大量流失。文章认为,这类人才流失,使其应对复杂故障的能力变弱。


而亚马逊云敢裁掉高级人才的原因就是对AI的过分迷信,AWS 的官方页面指出其 AI、机器学习服务覆盖从基础 ML(Amazon SageMaker)到生成式 AI(generative AI)再到「agentic AI」。

AWS 有篇博客 “How generative AI is transforming developer workflows at Amazon” ,表示内部使用其工具 Amazon Q Developer 来改变软件开发流程:“不仅仅是让开发流程更快,而是重塑开发者如何同代码、文档、知识交互”。
AWS 内部甚至有一个专门的 “DevOps and AI on AWS” 培训项目,展示用于开发者/DevOps 工程师的课程,教他们使用生成式 AI、自动化 CI/CD 管道、监控与可观测性等。
但 AWS CEO Matt Garman 又公开说:使用 AI 替换初级员工是 “我听过最愚蠢的事情”。他指出:初级员工通常最便宜、最愿意使用 AI 工具,如果你都不培养他们,10 年以后没人学到软件构建的东西。
所以,AI 代替人类其实是个很扯淡的群体性焦虑,尤其是在软件开发这种上下文信息爆炸的情况下,往往你的 token 都用完了,一个功能连 bug 都还没写出来。你要充钱上会员以后,项目能不能写明白另说,反正给大模型提供算力的锄头供应商是赚得盆满钵满了。
AI 辅助编码/自动化确实可能提高开发效率、降低常规任务压力,但当系统遇到 极端/边缘/历史遗留问题”时,还是需要资深工程师的直觉、经验、历史轨迹理解。

如果大量资深人才离开,同时又强力推进 AI 工具加速开发,那么组织可能更加依赖“自动流程/工具”而不是“人对系统整体理解及快速应急”的能力。结果可能会导致在复杂故障面前,虽然日常开发看似正常、工具推进顺利,但应急响应变弱、系统恢复速度减慢。


从行业视角讲:在云服务商/大型基础设施运营商中,AI 是重要助力但不能成为救命稻草。人才与经验仍然关键。
写出来我都觉得是废话。

当前环境下,我觉得 AI 的处境和智驾其实是很相似的。
在 L3 的分级标准确立且落地前,智驾出现的问题都是驾驶员承担。
只有当 L3 落地以后,这个责任才有可能会摊派到智驾服务商身上。
同理,当前的 AI 助手生成的任何内容、代码、素材,如果你拿来用惹麻烦了,责任还是在你自己身上。





根本原因AI根本不是知道输出什么内容,它只是在文字组合,概率生成。






回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2025-10-24 21:57 , Processed in 0.078108 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表