从AI 1.0的时代,钛媒体就紧密地关注 AI 领域的发展,而在 AI 1.0时代,无论是中国上市公司还是应用角度来看,与美国相比,我们好像已经有赶超的趋势(好像这个词用的太准确了)。但是到了 AI 2.0时代,也就是AIGC(生成式人工智能)时代下,我们突然发现,为什么中国一夜之间好像就变得落后了。
下午我都很认真的听了每一位嘉宾的分享,其中有嘉宾问到说,为什么现在GPT火了之后中国大模型很快就赶上来了,说明跟美国相比,中国的实力、能力建设就可能差了一点点。
但其实我现在想“泼点冷水”,我觉得短期来说我们可能有点太乐观了。不仅对中国市场过于乐观,而且可能对全球 AI 应用爆发的速度也可能过于乐观了。我认为,短期内没有大家想象那么快,长期又可能过于“忽视”,总想着是不是马上能赚钱。
我们报道10多年,一直跟踪这个领域,其实中国有很多 AI 领域的创业。但我们现在已经处于一个相对落后的状态,我们可能要更多地面对现实,怎么走出“伪AI创业区”。
第一大误区:中美AI差距只有1到2年
我认为很重要的就是,大家每次都谈谈中美 AI 差距大概是只有1~2年,那是不是真的就是1~2年,为什么会是1~2年?因为会有很多人说GPT3发布就在2020年,那可能在2022年chatGPT出来之后,我们也快速出来了类似于GPT3相关的模型,GPT4出来之后,我们也很快能出来一个对标GPT4水平的模型,就意味着我们相差的时间可能是1—2年,真的是这样吗?
我会觉得所有用这样时间来表述差距的都是“耍流氓”,因为那是人家创新蝶变的代际时间,不是我们的差距时间(能力水平)。
如果说GPT-5现在不能出来,我们可能10年都追赶不上。但是GPT-5出来,我们可能也许花2~3年能赶上。而GPT-5模型水平只是人家的创新节点、迭代时间水平,不是我们自己能力水平,这一点需要非常清楚,这也是我们本质上的一个差距。
我们要看到,这真的是创新引领的差距,不是一个我们花两年赶上一个模型就改变了中美 AI 差距了。
第二个误区:中国是全球最大的AI专利和人才市场。
我们常常会说,尤其是在AI 1.0的时代,中国投资人和创业者到美国硅谷做相关演讲说,中国 AI 已经领先于美国了。背后经常会提到的一个指标是,中国是全球最大的AI的专利和人才市场。
这个专利市场包括我们中国发布AI相关论文和申请AI专利的数量,可以说全球数一数二的,然后以及从事AI相关人才的数量,我们可以说全球数一数二。
但事实是什么样的呢?
中国确实在大学当中培养大量工程师、计算机领域人才,包括很多硅谷的大企业都到清华北大,到中国招聘计算机专业人才。
但是我们可以看到,即便是在2022年顶尖研究人员里面,虽然中国也是排在第二名左右,但是一上到顶级 AI 研究人员数量,只有美国的1/5左右。。如今,2024年可能比两年前更糟糕了。
所以这不是我们想的那样,中国是全球 AI 人才大国。
第三个误区:中国AI的主要障碍是在算力上“卡了脖子”。
中国 AI 的主要障碍在于“算力卡脖子”。我们认为算力卡了脖子,所以我们只要以各种手段能够买到相关的芯片,那是不是就已经达到相关水平了?
但是我想给大家泼一杯冷水的是,在这一轮AI 2.0的这一轮发展里面,不仅算力很重要,模型创新能力也很重要,数据能力也很重要。因此,现在的事实是,我们不仅是“算力”是瓶颈,我们的底层模型的创新能力、数据能力都是“瓶颈”。
我先说数据能力,很多人觉得中国是一个很大的应用市场,中国的消费者数据,企业行为数据等等各分析的数据一定是很丰富的,所以大家觉得中国是有充分的数据,但是我要非常残忍的告诉大家,很多数据都是无用数据,或者是不可用数据。
我在今年年初的时候跟美国气象的一个华裔科学家,同时也是中国气象所的顾问,在讲到气象数据的时候,我说我们也有相关的公司推动了相关气象计算预测的模型。那个科学家就非常直白的说了一句,我们所有的气象数据几乎都是没用的,因为我们缺乏对历史气象数据的整理,缺乏气象数据的归纳,缺乏气象数据相关的整合,变成可计算的数据。
目前对于中国而言,“都缺”。美国 AI 生态里面最重要的一个就是关于数据市场的建设。但在中国,理论上说是没有数据市场的。这个就是生态建设能力里很重要的,就是关于数据市场的建设。那你数据市场不成熟,你能算什么?
中国的模型公司,可以说在中文的计算能力上相对来说是领先的,但是整个中国的数据市场占全球的数据市场不到1%,以及再看所有的数据有效性的时候可以看到,世界主流所有相关的论文数据、研究数据,包括用户的应用数据,视频也好,还是文字也好,相关的应用数据,绝大部分依然是英文的数据。
所以如果我们不能很好的用英文的数据计算,我们如何能形成我们自己有足够竞争力的大模型,这个是很难的。这就是为什么我说我们不要以为美国只是卡了我们的算力脖子,好像只在半导体上发力就行了,实际上是整个生态能力建设,从算力到底层模型的创新,到数据能力和数据市场的生态的建设,我们整体都是落后的。如果非要用时间来说的话,真要把能力建设起来的话,没有十年的时间是很难把它很好的建设起来的。
AI 也不会违背一般商业定律,所以当基础能力积累到一定程度前,即便用了AI也不见得会取代原有产品。
这也是我今年跟Pika创始人在聊的时候,她最大的危机感。我问她你觉得Pika最大竞争对手是runway吗,她却说最大的危机感是来自OpenAI,因为OpenAI 一定是要做多模态的技术。所以我认为,当基础能力积累到一定程度之前,即便做了 AI 应用,也不会取代之前应用。
因为基础建设能力还没有达到为这个行业产生质变的时候,它就不可能变成一个“爆发”型新的 AI 时代。
很多人说,中国移动互联网应用就在全球领先,但我们现在所处的历史时间点位置不是对应互联网时代,移动互联网应用的爆发阶段,即AI当下发展阶段,不是后互联网发展阶段,而是相当于早期思科的阶段。
现在的英伟达就像当年的思科,当年思科在美国市场上一骑绝尘,一年能涨60倍股价的时候,那个时候有什么互联网公司是值得一提的吗?那时候很多现在的互联网公司可能都还没有出现。后来也是基础设施能力的提升,通信技术从2G到4G的发展,网络技术的提升、移动互联网、长视频短视频的应用逐渐出来。
现在的 AI 应用,还是在帮助我们怎么提高产业效率,但想要彻底改变这个行业来说还需要时间、需要耐心。
这就是为什么我们说,目前还是弱人工智能,中国的大市场优势暂时无法发挥。短期内,还是内容生成相关辅助工具为主,比如搜索、问答、文生图、文生音视频等。