机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 27|回复: 0

国产大模型快答时算数能力为零

[复制链接]

2万

主题

3万

帖子

21万

积分

超级版主

Rank: 8Rank: 8

积分
217080
发表于 昨天 10:17 | 显示全部楼层 |阅读模式
在网上看到一个帖子:“300+140=460对吗?”
我以为他在钓鱼,盯着屏幕笑了十秒。这在任何一个正常的人类大脑里,答案都毫无疑问是440。一个2026年的前沿大模型,怎么能算出460来?还能觉得它“对”?
然而试过国产大模型,在快速回答模式下,大部分沦陷。
其中千问在快速模式下,蠢出天际了。




即使是本地部署,千问照样是个弱智


那其它国产大模型在不使用思考模式时也这么拉垮吗

结果智谱大模型在快答时也是如此弱智


不管是哪里的大模型,只要不启用思考模式,那基本是白痴一个。
但如果事事启用思考模式才能降低幻觉,那更是白痴一个。

网上那么多豆包胡说八道的例子就是因其是运行在快速回答模式下,快答是AI背语料,不会核实语料对错。
而且字节为提高日活,让豆包AI极其谄媚,胡说八道程度更上一层楼。
而且至于中英文提问导致的回答质量不一样,那很正常。
因为简中网就特别垃圾了,这导致中文语料库也特别垃圾。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2026-6-1 06:14 , Processed in 0.109157 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表