大模型研发要钱,而在没有确定的营收之前,创投是核心的现金来源。但创投数据库 IT 桔子的数据显示,近两年来,无论 AI 的融资规模还是数量,相比 2017 年前后的 CV 热潮,都大有不足。但研发成本上,大模型却是上个时代 CV 的数倍之多。
于是,AI 行业一个怪圈出现了:早期,每当 Open AI 有新版本的大模型发布时,过不了三个月,国内一大批企业,就会引用第三方数据于开源数据集跑分,开始不断论证自家模型对各个版本 GPT 实现超越。
在这背后,为了迎合打榜需求,over-fitting(过拟合)也成为一个 AI 圈特有的现象,由于训练过程中,模型对某一或者某几个打榜用的开源数据集拟合过于精细,以至于模型记住了不少开源数据集特有的噪声,从而打榜分数居高不下,但实际应用中,效果却往往却一言难尽。