机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 400|回复: 8

苹果炮轰推理模型全是假思考

[复制链接]

2万

主题

2万

帖子

18万

积分

超级版主

Rank: 8Rank: 8

积分
186639
发表于 7 天前 | 显示全部楼层 |阅读模式
苹果最新大模型论文,在AI圈炸开了锅。
有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。
这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。
这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。

再遇到真正高复杂度的任务时所有模型都会崩溃,即使给他们足够的时间和计算资源也无济于事。

作者中包括谷歌大脑创始人之一Samy Bengio(图灵奖得主Yoshua Bengio的弟弟)。
苹果团队认为现有评估主要集中在既定的数学和编码基准上,看模型最终答案是否正确,但可能存在数据污染(模型训练时见过类似题目)。并且,这些评估大都缺乏对“思考过程质量”的分析,比如中间步骤是否逻辑一致、是否绕弯路等。
为了克服这些限制,更客观测试推理模型的推理能力,他们设计了4类谜题环境。
巧妙之处在于,四类谜题的难度可以精确控制,同时保持逻辑结构的一致性,研究者能够系统观察模型在不同复杂度下的行为变化,比如生成的每一步移动是否正确、是否重复试错。
https://mp.weixin.qq.com/s/WRPjXZRm4QRGOUzsJ4FxGA




回复

使用道具 举报

301

主题

6903

帖子

3万

积分

论坛元老

Rank: 8Rank: 8

积分
37526
发表于 7 天前 | 显示全部楼层
科学和技术都是可以质疑的,在不断质疑中修正和发展,最终造福全人类。
对AI质疑是好事,且绝对有益的,目前的AI不具备人类思维和逻辑推理的
能力。
但是不妨碍AI现在水平已经应用在很多领域了。

点评

AI,生成式AI,基于大模型的生成式AI,这三者的具体应用场合可是完全不一样的  发表于 7 天前
回复 支持 反对

使用道具 举报

1

主题

357

帖子

4031

积分

论坛元老

Rank: 8Rank: 8

积分
4031
发表于 7 天前 | 显示全部楼层
“AI技术应该叫统计科学而不是推理模型”
回复 支持 反对

使用道具 举报

1万

主题

4万

帖子

28万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
280441
发表于 7 天前 | 显示全部楼层
哈 ,我很早说过,我不用!因为影响生意!耽误赚钱,身处唐朝,蒸汽机很遥远,也许有!
回复 支持 反对

使用道具 举报

14

主题

159

帖子

5983

积分

论坛元老

Rank: 8Rank: 8

积分
5983
QQ
发表于 6 天前 | 显示全部楼层
思考一个问题啊:假如说将来AI发展成熟了,所有活都让AI和机器人做了。那么人类就没有用了啊。

点评

那球迷有没有用?  发表于 6 天前
开辟新路线,星际殖民,哈哈!  发表于 6 天前
回复 支持 反对

使用道具 举报

318

主题

2294

帖子

2万

积分

论坛元老

Rank: 8Rank: 8

积分
20516
发表于 6 天前 | 显示全部楼层
AI太虚了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2025-6-18 07:15 , Processed in 0.101451 second(s), 21 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表