机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 53|回复: 0

通用大语言模型是玩不转专业领域的

[复制链接]

2万

主题

2万

帖子

19万

积分

超级版主

Rank: 8Rank: 8

积分
192034
发表于 昨天 11:06 | 显示全部楼层 |阅读模式
本帖最后由 寂静回声 于 2025-9-11 11:07 编辑

Cursor是由Anysphere公司推出的著名AI辅助编程工具,联合创始人Aman Sanger提到:“如果能训练一个Transformer模型,让它不仅能预测代码的下一个token,还能预测CAD操作的下一个步骤,那就能做出一个真正实用、能极大加速机械工程设计流程的产品。这其实就是我们从创业开始一直到Instill(另一个初创项目)时期,甚至Instill之后一小段时间里都在专注做的事情。”
Aman说道:“在CAD这个方向上,我们进行了一些构思,而且当时我们对其他很多领域的竞争都非常担忧(当然,现在做的东西这种担忧已经小多了)。AI辅助编程领域竞争激烈,但CAD Automation看起来没什么人关注,技术上至少在当时看来是可行的,而且市场规模仔细研究下来也相当可观。所以,这既是一个非常有趣的技术难题,从市场分析角度看也像是个好主意。”
而后来,随着不断深入实践,Cursor团队逐渐发现了所面临的问题:
"第一,你能获取的CAD数据量远少于代码。如果你以为像Codex那样有500亿或1000亿token就足够了,那么也许用10倍少的数据(比如100亿token)也能训练出个有用的模型。但现实是,如今的Copilot背后很可能是数万亿token的代码和文本数据。而我们当时竭尽全力所能爬取到的所有CAD数据,最多也就100亿 token。这根本不足以训练出一个有用的模型。我们尝试扩大规模,但无论用什么正则化技术,模型参数规模一旦超过几十亿,就会严重过拟合。这是个大问题。"
"其二,缺乏迁移能力。即使你用今天的模型(比如 GPT-4)来测试——我有个喜欢用的提示词(prompt),可以用来区分背后是3.5还是4,但有时连GPT-4 都会搞错。当你逐渐增加描述的复杂度时,3.5很快就不行了,复杂度再高一点,4也跟不上了。这清楚地表明,这些模型在空间推理能力上并不强,而这恰恰是CAD所需要的核心能力。"

机械行业里许多人畅想“CAD + DeepSeek”之类的模式,认为只要将强大的人工智能,特别是大语言模型,与现有的BCAD软件结合,就能实现智能化。机械行业行业的本质,是遵循一套严谨的“工艺流程”的。无论是设计计算,还是车间生产,都是一步步、一个工序一个工序往下走的。
简单地将一个通用AI“嫁接”到一个CAD软件上,是一种“CAD+AI”的思路,但这条路肯定走不通,或者说,其能达到的天花板会很低。根本原因在于,产品全生命周期管理(PLM)是一个极其复杂、变量极多的庞大系统。通用的大语言模型,尽管在处理文本等单一模态数据时表现惊人,但面对机械领域高度专业化、多维度、强逻辑约束的复杂问题时,会显得力不从心。你无法指望一个AI在没有深度行业知识和流程拆解的情况下,仅凭“看”就能理解并生成一个完整、合规、可实施的项目。
此外,通用大模型的训练数据主要来自互联网公开信息,而行业真正的核心知识(Knowledge & Know-how)则源于企业内部的、具有知识产权的数据。企业一般不会把所有这些数据交给通用大模型来训练学习,也就是说通用大模型只能当一个万金油,不堪重用。
因此,我们讨论的结论是,真正的智能化,不是寄希望于一个无所不能的“通用AI”,而是要回归机械设计的本质,尊重“工艺流程”,将复杂的系统进行科学地拆解,在每一个环节上,用专注的AI和行业基础数据实现突破,再通过更高维度的智能调度将它们整合起来,形成强大的合力。










回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2025-9-12 06:13 , Processed in 0.098241 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表