机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 63|回复: 0

大模型最缺的不是记忆 而是举一反三的能力

[复制链接]

2万

主题

3万

帖子

21万

积分

超级版主

Rank: 8Rank: 8

积分
219675
发表于 3 天前 | 显示全部楼层 |阅读模式
过去大模型研究总在死磕“灾难性遗忘”:学了新知识就丢了旧技能。但行业内幕是,随着模型体量堆上去,“忘性大”这个伪命题早被大力出奇迹给暴力破解了。现在的千亿参数模型,靠着参数量够大和各种微调技巧,已经能挺过各种数据轰炸而不失忆。

AI现在真正的死穴,是缺乏“正向迁移”的本领,也就是人类最擅长的积淀和举一反三。一个数学家学了上百个概念后,学第一百零一个会越来越快;
但AI刷了海量任务,遇到全新领域依然像个空降的笨蛋,无法把过往经验真正转化为前瞻的学习力。

现在的补丁方案(如记笔记、调缓存、做知识蒸馏)都只是在上下文层面的小修小补。
说白了,我们人为在大模型的“即时记忆”和“长期参数”之间划了一道死线。
AI要想像人一样真正活学活用,必须打破这个时间跨度的硬边界,让短期刺激和长期可塑性彻底融为一体。

原文链接:infinitefaculty.substack.com/p/what-are-the-real-problems-of-continual

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2026-6-21 10:30 , Processed in 0.078919 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表