国产大模型快答时算数能力为零

寂静回声 · 发表于 2026-5-31 10:17:44

在网上看到一个帖子：“300+140=460对吗？”
我以为他在钓鱼，盯着屏幕笑了十秒。这在任何一个正常的人类大脑里，答案都毫无疑问是440。一个2026年的前沿大模型，怎么能算出460来？还能觉得它“对”？
然而试过国产大模型，在快速回答模式下，大部分沦陷。
其中千问在快速模式下，蠢出天际了。

即使是本地部署，千问照样是个弱智

那其它国产大模型在不使用思考模式时也这么拉垮吗

结果智谱大模型在快答时也是如此弱智

不管是哪里的大模型，只要不启用思考模式，那基本是白痴一个。
但如果事事启用思考模式才能降低幻觉，那更是白痴一个。

网上那么多豆包胡说八道的例子就是因其是运行在快速回答模式下，快答是AI背语料，不会核实语料对错。
而且字节为提高日活，让豆包AI极其谄媚，胡说八道程度更上一层楼。
而且至于中英文提问导致的回答质量不一样，那很正常。
因为简中网就特别垃圾了，这导致中文语料库也特别垃圾。

		自动登录	找回密码
密码			立即注册