机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 132|回复: 0

Google AI 又翻车了?一个 P 都没有 它数出了两个

[复制链接]

2万

主题

3万

帖子

21万

积分

超级版主

Rank: 8Rank: 8

积分
219303
发表于 6 天前 | 显示全部楼层 |阅读模式
谷歌最近被自己的 AI 绊了一跤,而且摔得很低级。
有人问 AI Overview:Google 这个词里有几个 P?
它认真回答:两个。
这事对硅基智能来说或许有点复杂,但对碳基生命来说毫无难度:Google 里没有 P。

其实这类翻车早就不是新鲜事。2024 年,“strawberry 里有几个 r”一度成了测试大模型的经典梗。答案明明是三个,但 GPT-4o、Claude 都曾在这个问题上栽过跟头。
所以这次 Google 里数出两个 P,荒唐归荒唐,却不是偶然事故。
一个能写代码、总结论文、分析财报、生成方案的 AI,突然在“数一数单词里有几个字母”这种幼儿园题目上摔了个大跟头。

实际上,大语言模型并不像人一样看文字。
人类看到 Google,会下意识按字母拆开:G-o-o-g-l-e。有没有 P,一眼就知道。
但 AI 看到的不是一个个字母,而是被切分后的 token。这个 token 可能是一个完整单词,也可能是半个单词,也可能是几个字符拼在一起。
模型处理的不是字符,只是一串被编码后的数字表示。
所以,AI 可以写出一篇像模像样的商业分析,却可能在 strawberry 这种单词上卡壳。
对人来说,数几个 r,就是把单词拆开看一眼。
对 AI 来说,它得从一堆被压缩、切分、编码过的语言碎片里,把那些字母重新抠出来。
这就像让一个擅长写报告的人,突然去做找茬游戏。
不是完全做不了,但很容易栽跟头。

过去的搜索,像是谷歌递给你一张线索清单:资料在这儿,真假你自己看。用户还要点开网页、看来源、比说法,多少得干点侦探活。
AI Overview 不一样。它不递清单了,直接端上一盘答案。摆盘精致,语气笃定,看起来像已经替你查完、想完、审完。它不像在猜,更像在拍桌子:就这个。
麻烦也在这儿。同样一个错误,出现在聊天框里,用户可能还会追问一句“你确定?”。但现在,它穿着搜索结果的西装,站在页面最上方,很多人就会顺手信了。
此前,谷歌 AI Overview 就已经出过不少名场面:一本正经建议用户吃石头,还认真讨论过往披萨上涂胶水。

更危险的,反而不是“Google 里有两个 P”这种笑话。
这种错太裸奔了,谁都看得出来。
真正麻烦的,是它在更专业的问题上说错半步。答案看起来完整,语气也稳,甚至还挺像那么回事。
它更可能悄悄混过去,然后被人当成正确答案。

以前搜索,谷歌给你线索,你知道自己还得查。
现在 AI 直接端出总结,很多人会下意识觉得:行了,答案有了。
问题就在这儿。AI 搜索省掉的,常常不只是点击,还有核查。

用户已经被 ChatGPT、Perplexity 这类产品养出了新习惯:不想翻网页,只想要答案。谷歌不跟,搜索入口就可能被别人抢走。
但入口越重要,错误就越不能轻描淡写。
Google 里数出两个 P,大家还能笑一笑。真正麻烦的,是它把更复杂的问题答偏了,还答得一本正经。

尤其是那种语气很稳、结构很全、看起来像标准答案的内容,最容易让人放下戒心。可一个连 Google 里有没有 P 都能数错的系统,最好先别急着交给它人类文明的驾驶权。
让它查资料、理线索、打草稿,都没问题。
但最后那一下确认,还得人自己来。
毕竟,AI 可以把答案写得像宇宙真理。
但有时候,它连单词都还没数明白。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2026-6-17 21:57 , Processed in 0.073277 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表