当下行业内达成的一个基本共识是,ChatGPT的出现标志着通用 AI 的起点和强 AI 的拐点,是 AI 领域科技创新和成果应用的一次重大突破,也是新时代数字化的“发电厂”。利用ChatGPT,以SaaS(软件即服务)服务的方式接入到干行百业,所有数字化系统和各个行业都值得用ChatGPT重做一遍。更多人未来期望ChatGPT使企业数字化业务流程更快、更高效、更智能。
不过,相比OpenAI和微软公布包括摩根士丹利、Stripe等公司使用ChatGPT的商业案例,国内“百模大战”中却出现了一个怪现象:技术和产品能力似乎都很强,但一到客户手里却出现各种bug,公布对话大模型的公司都在谈自身的技术能力强、场景化方案,部分还公布合作信息,但都极少在公开场合谈商业落地案过程。一位行业人士向钛媒体App透露,某家上市公司在一次电话沟通会上吐槽,其使用某互联网大厂研发的千亿 AI 大模型产品,尽管声称实现3分钟制作PPT、全球大厂中第一个同类型级别产品,但该上市公司最终将大模型接入公司系统时,却出现“一连接就死机”的情况。
近日在上海的一场AI大模型产业应用论坛上,一位 AI 大模型创业者甚至直言,过去几个月内发布的十几个大语言模型都大同小异,现状是全球只有OpenAI能够达到通用 AI 的商业化,且有绝大部分用户的市场。除此以外,国内 AI 大语言模型远没有达到可商用化程度。
“在我看来,ChatGPT这波AI 2.0能否真正发展起来,取决于是否有商业模式,是否有客户来买单。GPT这类大模型无论怎样去训练,如果没有应用、没有场景、没有买单、没有商业模式,它就不可能成功。”6月2日上海临港的一场圆桌上,云网一体化云计算上市公司首都在线执行总裁姚巍直言,AI 大模型的商业化对于行业发展极为重要。
AI模型现在非常火,并被赋予了第四次工业革命的期许。但目前看AI获得大量互联网数据,却无法很好地辨别信息的真实性和可信度。结果就是,我们不得不面对一大堆快速生成的低质量内容。
点开知乎的“等你回答”这个栏目,随机找一个问题,能碰到不少“机言机语”的回答。
各类AI生成的假新闻屡见不鲜。前一段时间,江西男子陈某为吸粉引流,利用ChatGPT生成一则耸人听闻的消息在网上疯传,标题是《郑州鸡排店惊现血案,男子用砖头砸死女子!》。
以及广东深圳的洪某弟也是通过AI技术,发布过《今晨,甘肃一火车撞上修路工人, 致9人死》的假新闻。当然警方均已对他们采取了刑事强制措施。
设想一下,一个成长于垃圾、虚假数据环境中的AI,在进化成人前,很可能先被拟合成一个“智障机器人”,污染互联网世界。
创新工场董事长兼CEO李开复曾表示,AI 2.0时代进入提升生产力的应用井喷期,存在巨大的平台式机会,而且将是中国在AI领域的第一次参与平台角逐的机会。具体来说,结合大模型相关企业研发信息以及券商研究报告,还有微软最近对外公布的应用场景,钛媒体App以下梳理出ChatGPT类产品在七大行业里面主要的商业化应用。
不过,上述内容更多属于“纸上谈兵”,用PPT畅想 AI 前沿技术将场景智能化升级。最终在落地的时候,参数规模“竞赛”很是热闹,但真正走到规模化产业部署的还寥寥无几,后续的模型修正和迭代进化也进展缓慢。不论是数据出现“一本正经胡说八道”,还是中英语言翻译不准、算力不够、价格昂贵等因素,AI 全面辅助购物、金融与制造业的观点是片面的,提交到客户应用时并非易事,可能会出现矛盾和问题。
例如,在云知声发布会现场演示中,当询问医疗领域专业问题“治疗闭角型青光眼的治疗药物应选择什么?”的时候,ChatGPT回答的是阿托品。钛媒体App也尝试了这个问题的回复,基本上是错误信息或不属于国内药品法规下能买到的药物,而正确答案则是毛果芸香碱。
同时,由于大模型背后大量采用英文数据语料,而非中文互联网数据,因此会出现语言不通的现象。比如输入“鱼香肉丝”,会出现一个被切成丝的活鱼图片这种“尴尬”情况,所以在商业化过程中会出现一些问题。一家金融领域企业高管此前告诉钛媒体App,由于ChatGPT在数学计算方面能力较差、一些信息无法实时更新,因此国内大模型产品在金融领域效果并不佳,尤其会出现汇率和贷款信息错误,而且会产生信息不对称情况。
今年4月 AI 公司第四范式举行的发布会上,一位银行公司代表提到,在金融行业因为信息不对称可能会导致更高息的信贷产品或者存款利率,但其实就算信息都给你,也可能做出的选择并不是最优的。“我们是做金融的,面向公众服务,我传递的任何信息必须是准确的。”上述代表认为,大模型在企业落地时面临挑战主要就三点:内容可信风险、数据安全风险、落地成本高昂。在制造业中,内容问题可能会产生更严重的影响。因为人工的瑕疵与错误会被严格限制,一些高精尖工艺需要分毫不差,一旦 AI 系统出现错误,可能会引发一场事故。
互联网上有关工业品、工业设备的信息与资料本来就比较少,相对于大而统的消费品类、编程类、经管类、金融类等等学科,简直就是小巫见大巫。
ChatGPT是基于大数据开发的应用程序,本来网络上各种文字质量就参差不齐,所以ChatGPT的水平也不会特别高。而当下,有关工业品、工业设备的文字更是少的可怜。
另外,透过ChatGPT生成的文案,还会发现有一些文案纯纯是“废话连篇”,总少了那么一些感觉。说明AI工具只是解决重复性、废话类型的流水线工作。
清华大学惠妍讲席教授、AI 公司衔远科技创始人周伯文对钛媒体App表示,现在像ChatGPT这样的大模型进展很快,但问题在于它可能一本正经的“胡说八道”。尤其在专业领域,外行看它像内行,内行看它像外行。同时,内容的原作者视其剽窃,但普通用户则视其在创造,实际它尚不具备原创性的思想。
据Wired报道,今年至少有15篇arXiv研究论文探讨了大模型的多语言性。但研究人员发现,包括ChatGPT在内的 AI 系统更擅长将其他语言翻译成英语,而很难将英语重写成其他语言,尤其是韩语、非拉丁文字等。不仅如此,ChatGPT在回答事实性问题或总结非英语复杂文本方面的表现要差得多,更有可能是伪造信息。
多家传统制造领域的企业创始人告诉钛媒体App,他们要与大模型、做 AI 技术研发公司来合作,主要还是创业公司受限于算力、数据、电力等高昂成本,无法自炼大模型。而透过 AI 公司团队进行一定的数据合作,之后一旦懂得这个技术秘诀,就自己搭建团队做。“我们绝对不会在一家 AI 公司上长期合作,因为价格太贵了。”一位供应商告诉钛媒体App。
解决大模型落地问题,总结来说主要有三方面:提高内容可信;解决算力成本高、训练重复和资源紧缺的问题;大模型价格需要不断降低,或使用垂直领域模型落地。
中国科学院院士、清华大学人工智能研究院名誉院长张钹认为,ChatGPT没有解决的就是自我学习的能力,这是ChatGPT最致命的地方,因此需要把更多数据去优化以进一步解决实际应用问题。“不要认为ChatGPT能解决全部的人工智能问题,没有重新学习的能力,不可能应对变化。国内、国外都一样,我问美国的ChatGPT也是这样来答的,问中国的ChatGPT,有的做得比较好,有的也是错误的。这就给我们提出一个问题,我们要把它用到这些决策问题上面去,这个重大问题需要进一步解决。”张钹表示。
旷视科技物流业务事业部的负责人徐庆才在最近一次交流中提到,目前大模型需要走向垂直化,可以结合场景用一个模型和一个框架下统一去提高内容精准度。“目前依然有一定差距,这个差距来自于现在技术上的不可实现,来自于现在没有找到一个好的方式实现这个东西,这就是我们现在需要来看,现在新技术到底能不能够弥合这个点,我们判断这些问题很快都会被解决。”徐庆才表示。
其次是解决算力成本高、训练重复资源却紧缺的问题。一家 AI 算力公司联合创始人张新(化名)对钛媒体App提到,以GPT-3模型为例,现有千卡集群训练一个月,单次训练周期一个月,总成本超过1200万美金。今年上半年,全行业(训练卡)在涨价,持续涨价超过25%。但在这样一个情况下,今天仍然没有人能够用商业化的国产芯片去做大模型的训练。数据、算力、算法三要素当中,算力是基础,也是大模型竞争力,但国产芯片在软件适配度、稳定性方面仍显不足。张新认为,国产芯片与英伟达显卡之间的解耦能力较弱,他们相信可能未来的几个月内逐步用国产芯片去做百亿,甚至更大体量的模型的训练,但算力的累积依然是重要挑战。
砺算科技联合创始人、联席CEO孔德海认为,可以从四方面来解决算力矛盾问题:一是协同化,把很多运算可以跑在云端,并根据需求进行协同;二是模型小型化,在高质量数据前提下,小型模型可以在单机上运行;三是再训练,在有限条件下,反复训练有助于提升用户体验;四是融合计算。目前,AI 大模型算力主要在训练、推理两个部分,其中成本最高部分是前期的模型训练,大部分采用智能计算中心、自费买英伟达A800/H800显卡组成服务器运行、或者是用价格更为实惠的服务器云来训练。而推理部分算力需求较少、价格不高,大部分模型应用都需要同时建立公有云、私有云两种混合模式,而且需要购买一定的云服务,以更好做大模型应用。
价格是大模型商业化最重要的因素。由于训练成本高、数据筛选难度大,因此,千亿参数模型的报价高达数十万元,而高昂的售价让很多客户望而却步。戴文渊向钛媒体App表示,不是所有的场景、客户都能接受千亿参数的成本,这个需要客户选择,即便是千亿、万亿的参数只是代表你的最高能力,但最后给到客户的时候,就不一定所有的场景都能技术释放。而垂直大模型的数据生成规模会小一些,场景更易用,Chat的思维能力更高。比如,彭博此前发布了金融领域的大模型BloombergGPT,应用于其所在的垂直领域;医联则发布发布内首款医疗大语言模型MedGPT,可在真实医疗场景中发挥实际诊疗价值。无论是医疗、金融、电商等领域,都需要垂直性大模型产品。
嘉御资本董事长兼创始合伙人卫哲最近提到,“我们不碰大模型。”卫哲认为,多年互联网从业下来告诉人们,一定是头部占据60%、70%的份额,搜索引擎、电子商务无一例外,这次人工智能也是如此,胜出的大模型在中国很难超过2个,在中国以外的世界包括美国,也很难超过2个。
就目前“百模大战”来说,正如周鸿祎所说,大模型关键在于让更多人去使用,将大模型能力与更多场景相结合,打造更多落地应用。所以总结来看,大模型必然是只有极少数公司能做起来,给创业公司的机会很少。甚至可以说,如果不能把大模型商业化,这家企业一定会输在这轮赛道比拼中。因此,摆在大模型企业面前的问题非常严峻,如何将大模型更快落地应用,将技术能力释放并与更多场景相结合,真正产生新一轮科技革命和产业变革,是当前紧要的关键问题。而关于大模型的落地,我们还有很长的路要走,需要时间、需要机会、需要生态。