这不仅是腾讯大模型的困局

寂静回声 · 发表于 2024-11-15 13:21:37

最近，腾讯终于有了新动作，在开源模型上卯足了劲。11 月 5 日，腾讯宣布开源 MoE 大语言模型混元 Large，腾讯称混元 Large 是业界参数规模最大、效果最好的开源 MoE 大语言模型，采用 7T 训练 tokens，总参数量 389B，激活参数量 52B，上下文长度高达 256K。

然而，从去年年初至今，在文本大模型的战场上，身为BAT三巨头之一的腾讯，却长久地处于被动的状态。

一个明显的表现是：在10月国内Web端AI助手的排行榜上，腾讯的AI产品元宝仅排在了第11位，月访问量不到200万，远不及百度的文心一言、与阿里的通义千问。如今，在国内的AI应用上，要问起知名度最高的前三个，人们可能很难会想到腾讯的元宝。
问题来了：同样身为BAT三巨头之一，且有着微信这样一个超级入口，为何腾讯却在C端方面表现如此不堪？
一个重要的原因，恐怕并不是腾讯的元宝有多“差”，而是在于在众多国产大模型的AI产品中，元宝是一个十分四平八稳，平庸到毫无“特色”的存在。

从当前国内大模型的概况来看，脱颖而出的玩家，往往有这么两类：
代表玩家，有百度、字节、阿里。
月之暗面kimi、智谱清言为代表的。

从当前国内大模型的概况来看，脱颖而出的玩家，往往有这么两类：
一类走的是市场路线，凭借其在多个业务线中积累的大量数据，将用户与内部场景进行深度整合，增强其在C端用户中的吸引力；这类的代表玩家，有百度、字节、阿里。
另一类则是以月之暗面、智谱清言为代表的。

相较之下，BAT中的百度、阿里，在大模型方面的组织架构则集中得多。无论是百度智能云，还是阿里达摩院，都能在同一战略目标下集中算力资源，将模型与应用紧密协同。
腾讯的分离架构，在一定程度上导致了资源整合的困难，尤其是在GPU资源、算力需求等方面难以快速响应，从而影响了大模型的训练和应用速度。
说到底，这是因为腾讯长期以来专注于“社交”“娱乐”等业务的结构，决定了其组织形态更适合产品迭代而非技术突破，其技术研发更多服务于具体业务需求，而非系统性的基础研究投入。
虽然与腾讯相比，字节也同样是以娱乐内容起家的互联网巨头，但这其中的关键区别就在于：由于在短视频形成的内容导向策略，让字节跳动旗下的抖音、今日头条等产品需要时刻追踪用户喜好，快速迭代功能和内容，使得字节必须更注重算法、数据上的积累。

很多人质疑腾讯在大模型方面的滞后时，往往会想：既然腾讯背靠着QQ、微信这样的超级入口，那其为什么不将自身的元宝大模型整合进其中，通过流量效应取得优势？
关于这点，一个深层的原因，就在于微信和QQ等社交生态的崛起，靠的不是技术，而是运营策略和庞大的用户数。
靠着互联网时代“跑马圈地”的策略，腾讯已经稳坐了这个江山，对于腾讯而言，这是其最核心的资产，在此情况下，任何过于“新锐”的技术，都可能影响用户体验的改变，从而会被视为高风险操作。
尤其是当前大模型技术尚未完全成熟的情况下，各种幻觉、错误等问题，都会带来难以预料的负面影响。

更重要的是，社交场景中的对话往往涉及大量私密信息，如何在提供AI服务的同时，确保用户隐私安全，这是一个技术上和伦理上都极具挑战的问题。

而这也引出了一个有趣的悖论：在互联网时代，塑造各个巨头的优势因素，在AI时代，反而可能成为一种潜在的掣肘。
在当下大模型的竞争中，最重要的环节之一莫过于数据。
从这方面来看，腾讯的技术积累和商业模式与阿里有着本质区别。阿里则依托电商生态，拥有丰富的场景化数据和完整的产业链支持。

相比之下，腾讯虽然在社交领域占据优势，但其数据属性更偏向于即时通讯和娱乐，这在大模型发展的物质基础上就形成了先天差异。
更深层次来看，这样的差异，也反映了不同企业在面对技术变革时的路径依赖。腾讯的商业基因更偏向于连接与娱乐，而大模型技术的突破性应用，首先体现在知识服务和生产力工具领域。这种错位，使得腾讯在大模型竞争中不得不采取更为谨慎的策略。

与阿里建立构建统一的分布式计算框架，开发可复用的基础算法组件相比，腾讯的创新，更像是一种“自上而下”的模式：即为特定产品优化算法性能，解决局部场景的技术问题。

这样的技术差距，背后的根本原因在于腾讯的技术创新范式，与大模型这种需要持续深耕的底层技术存在结构性矛盾。
可以说，从早期的QQ到微信，再到现在的AI大模型，马化腾式的商业智慧，更多地体现在资本配置和生态搭建上，而非原始技术突破。
在互联网时代，腾讯通过投资大量初创公司和科技企业，以“买、买、买”的策略，极快的速度扩展了业务版图。在大模型和AI领域，腾讯大模型开发更多依赖开源技术和已有算法框架，但在核心技术积累上，并未能形成像阿里的M6这样的自研基础设施。

其实老矮子说小矮子，谁也别说谁。国产大模型都一个jb样。
998说光一个共析点，就可以国产模型绕死。现在我只需提问“生物柴油的硫含量”，就可以把号称国产大模型之首的通义大模型暴露出胡搅蛮缠的特性出来，逻辑呢，逻辑呢。

通义大模型被生物柴油厂家收买了吗，这点问题怎么就说不明白。

百度成天吹啊吹，结果文生图照样是个250。

		自动登录	找回密码
密码			立即注册

这不仅是腾讯大模型的困局

本帖子中包含更多资源