机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 23|回复: 0

达索系统:非参数化AI

[复制链接]

2万

主题

3万

帖子

20万

积分

超级版主

Rank: 8Rank: 8

积分
203942
发表于 昨天 10:10 | 显示全部楼层 |阅读模式
在波士顿举行的达索系统2025科学周上,Jing Bi博士的演讲《用于可信物理人工智能的虚拟孪生》,试图回答这个问题。她是达索系统SIMULIA的机器学习物理技术高级经理,是一位在机械工程领域深耕多年的科学家。她所展示的,是通过理解事物运行的深层规律(无论是物理方程还是神经网络的潜在空间),来解开自然的谜题。




以下内容是Jing Bi博士精彩演讲的大致内容。
第一章:科学发现的第四范式
如果你仔细观察科学史的发展轨迹,你会发现我们一直在试图用不同的方式去“描述”这个世界。


最早的时候,我们处于“实验科学”的时代。第谷仰望星空,记录行星的位置;伽利略让小球沿斜坡滚下。这是基于经验的范式,我们观察现象,记录数据,试图从中提取规则。这很美妙,但很原始。
接着,我们进入了“理论科学”的时代。牛顿出现了,麦克斯韦出现了。我们开始用简洁的数学公式来描述宇宙。F=ma,简简单单三个字母,却概括了万物的运动。我们不再仅仅依赖观察,我们开始用普遍定律去推导未知。
随着计算机的诞生,我们迎来了第三范式——“计算科学”。既然不仅有公式,还有了算力,我们就可以用数值模拟(Numerical Simulation)来解决那些解析解无法处理的复杂问题。比如有限元分析(FEA),我们把一个复杂的汽车零件切分成无数个小网格,对每一个网格应用物理定律。虽然这很慢,但它非常准确,它是基于规则的。



而现在,我们正处在第四个时代——数据驱动的科学,也就是机器学习和人工智能的时代。
这里存在一个巨大的诱惑。人工智能,特别是深度学习,擅长从海量数据中寻找模式。它速度极快,快得惊人。但是,作为一个物理学家或者工程师,我们内心深处总有一种不安:AI是基于数据的,它不懂物理定律。如果你给它喂了错误的垃圾数据,它就会自信地吐出错误的垃圾结果。

所以,我们现在的目标非常明确:我们要融合这两种力量。我们要将基于规则的数值模拟(那是我们对物理世界的深刻理解)与基于数据的机器学习(那是处理复杂性的高效工具)结合起来。我们要创造一种“基于物理的非参数化AI”(NPP-AI,Non-parametric physics based AI)。这听起来可能有点拗口,但请相信我,这是通往未来的钥匙。


第二章:生命科学中的不可能三角
在工程领域,我们经常面临挑战,但生命科学领域的挑战尤为棘手。与其说是挑战,不如说是横亘在医疗设备创新面前的三座大山。
首先是设备的生命周期问题。当你设计一个植入人体的心脏瓣膜或支架时,你必须知道它能用多久。传统的做法是做物理耐久性测试。这非常昂贵,而且耗时极长。你不可能为了测试一个瓣膜这辈子会不会坏,真的等上一辈子。当然,我们可以用建模和仿真来替代,它们准确且相对较快,但建立这些模型本身就需要巨大的工作量。如果我们想用AI来加速,我们面临一个尴尬的局面:我们的笔记本电脑里可能躺着过去十年的历史数据,但这些数据就像巴别塔的碎片,它们有着不同的几何参数,互不通用,我们无法从中提取统一的知识。



其次是手术规划的难题。每一个病人都是独一无二的。当医生拿到病人的医学影像数据时,这些数据往往充满了噪点,甚至是不完整的。有的地方模糊不清,有的地方缺损。在这种情况下,我们仍然需要做出极其准确且快速的预测。医生在手术台上没有时间等待一个星期的仿真结果,他们需要的是即时的反馈。
第三个挑战是如何从个体推向群体。这被称为“计算机模拟临床试验”(In-silico clinical trial)。我们可以为单个特定的病人建立完美的模型,通过调整参数来校准,但这太慢了。如果我们要通过监管机构的审批,我们需要证明这个设备在成千上万个不同解剖结构的人群中都是安全的。我们需要一种方法,能够快速地为整个人群建立模型,而不仅仅是个例。



在达索系统SIMULIA,我们早在2023年就开始构建神经代理(Neural Surrogate)解决方案。起初,我们走的是一条经典的路径——参数化AI(Parametric AI)。
我解释一下什么是“参数化”。想象你在设计一个瓶子。你可以定义几个参数:瓶子的高度、瓶底的半径、瓶颈的宽度。这三个数字就是参数。当你改变这些数字时,瓶子的形状就变了。


我们的第一版产品就是这样工作的。即使你不是AI专家,你也可以通过三个步骤来训练一个模型。首先,建立一个参数化模型,定义好哪些几何参数会变化,以及它们的变化范围。然后,设计一个实验表(DOE),让计算机自动运行成百上千次仿真,生成数据库。最后,进入训练环境,选择你要学习的输入变量和输出结果,点击训练。



这套系统非常有效。我们已经在内部验证了它在各种物理场景下的能力。无论是显式动力学分析(比如手机掉在地上的瞬间),还是流体模拟、电磁模拟,甚至是整车级别的碰撞测试,它都能工作。一旦模型训练完成,设计师就可以在几秒钟内得到结果,而不需要等待数小时的仿真。


但是,作为一个追求完美的工程师,我们很快就撞上了一堵墙。这堵墙叫做“参数的连续性”。
在现实的工业设计中,产品是从概念设计演变到详细设计的。在概念阶段,你可能只关心整体的长宽高。到了详细设计阶段,你突然决定加一个倒角,或者挖一个孔。这时候,你需要引入新的参数。这一瞬间,你的参数链条断裂了。你的新模型和旧模型在参数层面上是无法沟通的。


更糟糕的是,当你开发下一代产品时,你可能想做出颠覆性的创新形状。这个新形状根本无法用上一代产品的参数来描述。这就意味着,你过去十年积累的所有仿真数据、所有关于物理世界的知识,在这一刻都变成了废纸。你必须从零开始,重新生成数据,重新训练模型。
这是对计算资源的极大浪费,也是对人类智慧的浪费。我们不能容忍这种情况。我们必须打破参数的枷锁。



这就是为什么我们在2024年开始研发,并计划在2026年正式发布的重磅技术——非参数化AI(Non-parametric AI),或者叫通用几何表达AI。
这一次,我们不再关心你是用什么参数来定义形状的。我们直接看事物的“本质”。
无论是网格(Mesh)、点云(Point Cloud)还是STL文件,这都是原始的3D数据。我们训练神经网络直接“看”这些数据。即使你完全不知道这个形状是怎么参数化的,AI也能通过学习这些点和面的空间关系,提取出一个潜在的表示(Latent Representation)。


这就像是一个科学家在看一个复杂的机械装置。他不需要知道设计图纸上的尺寸标注,他只需要看这个装置的结构,就能理解它的功能。
通过这种技术,我们可以把过去十年里所有乱七八糟的历史数据库利用起来。哪怕这十代产品的形状天差地别,哪怕它们没有任何共同的参数,只要它们遵循同样的物理定律,我们就可以把它们扔进同一个熔炉里训练。



我们正在构建的是一种企业级的基础模型(Foundational Model)。它能够捕捉几何变化与物理场解之间那层深不可测的映射关系。这意味着,当你设计第十一代产品时,你不需要从头再来,你站在了前十代巨人的肩膀上。
这项技术的核心在于其训练环境的底层逻辑发生了质的飞跃。虽然对用户来说,界面看起来和以前差不多,但后台的算法复杂度和计算深度完全是另一个维度的。我们在支持达索系统自家的Abaqus、CST、PowerFLOW等求解器结果的同时,也开放怀抱,支持第三方数据。因为物理定律是普世的,不应该被软件格式所局限。



现在,我要谈一个非常严肃的问题:信任。
当我们使用有限元分析时,我们信任它,因为我们知道这个是纳维-斯托克斯方程,那个是胡克定律。但当我们使用AI时,它是一个黑盒子。尤其是当我们做盲测(Blind Prediction)时,给AI一个它从未见过的形状,它吐出一个结果。我怎么知道这个结果是不是它胡乱编造的?
为了解决这个问题,我们在软件中构建了三项关键技术,这不仅是为了让AI跑得快,更是为了让你敢用它。


第一项技术是数据分析与置信度度量(Data Analytics and Confidence Measurement)。既然AI是通过几何编码(Geometric Encoding)来理解世界的,那我们就要把这个过程可视化。即使用户没有参数,我们也要让他们看到这个“潜在空间”长什么样。
你可以利用我们的工具,分析你的新设计在潜在空间中距离历史设计有多远。如果你的新设计落在历史数据的分布范围内,我们就会给出一个高置信度分数。如果你的新设计完全飞出了已知的宇宙,我们会警告你:“嘿,这个设计离我见过的所有东西都很远,AI的预测可能不准,你最好跑一次真正的物理仿真来验证。”这种坦诚,是建立信任的第一步。



第二项技术是多架构机器学习方法论(Multi-architecture ML)。没有一种神经网络是万能的。对于流体问题,可能基于Transformer的架构更好;对于结构力学,可能基于图神经网络(Graph-based)或神经算子(Neural Operator)的架构更有效。我们不迷信某一种算法,我们根据物理问题的本质,选择最合适的数学架构。我们支持从网格到点云的各种输入,并且不仅能预测单一数值,还能预测整个3D物理场(3D Field)。
第三项技术,也是我们作为工业软件公司的立身之本——可扩展性。我们不是在玩玩具模型。我们的客户要处理的是整车、整机,涉及数百万个节点和单元。我们通过并行计算和算法优化,确保这套AI方案能够吞吐工业级的海量数据。



让我们来看几个真实的物理案例,看看这套系统到底有多强。
首先是汽车空气动力学。这是所有车企的痛点。为了省油,为了增加电动车的续航,设计师需要疯狂地优化车身外形,以减小风阻(Drag)。
如果你用PowerFLOW软件做一次高精度的流体仿真(CFD),对于一个详细的车型,这需要在100个CPU上跑整整一个星期。想想看,设计师改了一个后视镜的弧度,然后要等一周才能知道这有没有用。这太痛苦了。
而当我们训练好AI模型后,预测同样的结果需要多久?不到一秒。



如果你是一个吹毛求疵的科学家,你会问:“具体的数值呢?”我们把所有测试案例的风阻系数(Drag Value)画在坐标系里。横轴是真实仿真值,纵轴是AI预测值。完美的预测应该落在45度的红色虚线上。结果显示,所有的点都紧紧地贴在这条线上。即使对于AI从未见过的全新设计(盲测),误差也控制在1%以内。
这意味着什么?这意味着概念设计师可以在一天之内尝试几千种不同的设计,实时看到风阻的变化,快速迭代,直到找到那个最完美的流线型。



但这还不是全部。我们的新界面允许这种交互变得像玩游戏一样直观。设计师拖入一个新的几何体,比如换了一套轮胎,或者改了挡风玻璃的角度。只需要加载预训练模型,点击“预测”。瞬间,3D视图上就显示出了新的表面力分布。他可能会发现:“哎呀,引擎盖上的阻力变大了。”于是他再次修改,再次预测。
在演示视频中,我们的工程师发现后视镜产生了一些不必要的阻力,他甚至尝试增加了车尾掀背的角度。每一次微小的改动,AI都像一个不知疲倦的物理助教,瞬间给出答案。这不仅是效率的提升,这是创造力的解放。



再来看一个更“硬核”的例子:车身结构安全设计。
我们在设计B柱(B-pillar),就是车窗中间那根柱子。在翻车事故中,它必须足够强壮,才能保护乘客。这是一个典型的非线性结构问题。我们需要预测的是“等效塑性应变”(Equivalent Plastic Strain),通俗地说,就是看金属在哪里发生了永久变形,变形了多少。



这是一个非常棘手的问题。因为B柱的几何变化往往是非常局部的,非常细微的,而在整个巨大的车身模型中,这一点点变化很难被AI捕捉到。我们必须训练AI去自动聚焦这些微小的差异。
结果令人振奋。我们将AI预测的塑性应变云图与有限元分析的基准真值(Ground Truth)进行对比,发现AI不仅准确预测了材料损伤的位置,连损伤的程度(Magnitude)也吻合得很好。更进一步,我们不仅仅是预测最终状态,我们还能预测随时间变化的动态过程。你可以看到整个碰撞过程中,金属是如何一点点弯曲、折叠的。



这还不够。我们还在与伊利诺伊大学(UIUC)的合作者们探索一种混合学习(Hybrid Learning)的新边界。
在这个混合学习的实验中,我们面对的是一个极其微妙的生物力学问题:心脏瓣膜的开合。
请想象一下,你的心脏里有一扇门,它每天要开关十万次。这扇门就是瓣膜。它的形状是不规则的(非参数化的),但它的材料属性、腱索的长度等物理量又是可以被量化的(参数化的)。如果我们只用几何AI,我们忽略了材料的硬度;如果我们只用参数化AI,我们又无法描述那复杂的有机形状。
所以,我们和伊利诺伊大学(UIUC)的合作者们尝试了一种“杂交”的方法。我们在输入端,同时喂给神经网络两样东西:一个是瓣膜的通用几何表达(网格数据),另一个是代表物理属性的参数列表。


我们的AI不仅学会了这些形状,它还学会了诊断。它准确地捕捉到了瓣膜开启的特定模式,这些模式直接对应着不同的疾病类型。而且,这一预测过程依然是毫秒级的。这再次证明,无论是钢铁构成的汽车,还是胶原蛋白构成的心脏,在数学的底层逻辑上,它们共享着同一套物理法则,而我们的AI正在学会这套法则。


现在,我们要回到演讲开始时提到的那三座大山——医疗设备行业的三个终极挑战。有了非参数化物理AI这把利剑,我们看看如何将其劈开。
挑战一:设备的生命周期管理与历史数据的复活
在医疗设备公司,比如设计经导管主动脉瓣置换术(TAVR)设备的企业,通常有着严格的代际更替。你可能听说过爱德华兹(Edwards)或者美敦力(Medtronic)这样的名字,他们的产品从第一代到第十代,每一代都有不同的几何设计。
过去的情况是悲剧性的。当你开发第十代产品(比如Sapien 3 Ultra)时,你前九代产品(比如Sapien XT)积累的数千次仿真数据,基本上就成了躺在服务器硬盘里的“电子尸体”。为什么?因为第一代的几何参数定义和第十代完全不同,计算机认为它们是两种完全不相干的东西。



但是,物理学告诉我们,流体流过第一代瓣膜所遵循的规律,和流过第十代瓣膜所遵从的规律,是完全一样的。纳维-斯托克斯方程不会因为你的产品型号变了就改变。
通过非参数化AI,我们正在构建一种“企业级基础模型”(Enterprise Foundation Model)。我们可以把一家公司过去二十年所有的历史数据——不管是圆的、扁的、长的、短的设备设计——全部扔进去训练。AI不看参数,它看形状的本质。
这样,我们就训练出了一个“懂瓣膜”的AI。它不仅仅是记住了某个特定型号的数据,它提取了关于“人工瓣膜”这个概念的普遍知识。当你开始设计未来的第十一代产品时,你不再是从零开始。你拥有了一个包含了整个企业历史智慧的大脑在辅助你。这种知识的提取和复用,将把新产品的研发周期从几年缩短到几个月。历史数据不再是负担,而是最宝贵的资产。



外科医生面临的现实往往是残酷的。他们拿到的病人医学影像(CT或MRI),并不像我们的CAD模型那样完美无瑕。图像里充满了噪点,有时甚至有缺失的部分。这就好比你要根据一张模糊的、被咖啡渍污染的蓝图来建造大楼。
在二尖瓣修复手术的规划中,如果我们直接让AI根据这些模糊图像做预测,它很可能会出错。毕竟,AI是基于数据的,垃圾进,垃圾出。
为了解决这个问题,我们设计了一个巧妙的“三明治”流程,或者叫迭代反馈回路。



首先,我们用基于大量临床数据和仿真数据训练出来的AI模型,对病人的情况做一个初步预测。比如,预测左心房的压力。
然后,关键的一步来了。我们引入物理模型进行“校准”。我们把AI的预测结果喂给一个简化的物理模型,看看这个结果是否符合物理定律。比如,血液的流速和压力是否满足伯努利方程?如果AI预测的结果违反了物理定律,物理模型就会“惩罚”它,并给出一个修正方向。
我们将这个修正后的误差反馈给系统,自动调整模型参数(比如腱索的长度、组织的刚度),然后再次预测。这个过程就像是AI和物理学在进行一场快速的对话:“我觉得是这样。”“不对,根据动量守恒,应该是那样。”“好的,我调整一下。”


经过几次迭代,系统收敛了。在这个过程中,我们不仅得到了准确的手术预测,我们还顺便完成了一件非常困难的事情——自动调参。我们通过这个过程,间接地推算出了该病人特有的生理参数。
这就是我们所说的“基于物理的AI”(Physics-based AI)。我们用物理定律作为护栏,将AI的狂野想象力约束在现实的边界之内。这样得出的结果,才是医生敢在手术台上参考的“可信结果”。



最后一个挑战是关于规模的。我们能为一个个体建立完美的“虚拟孪生”(Virtual Twin),但这还不够。为了证明一个新药或新器械对所有人都安全,我们需要在成千上万个不同的人身上做测试。
在现实世界招募几千个志愿者进行临床试验,既昂贵又有风险。如果我们可以用计算机生成几千个“虚拟病人”呢?
这就是非参数化AI大显身手的地方。因为我们是在潜在空间(Latent Space)中对几何形状进行编码的,这个潜在空间就像是一个包含了所有可能的人体心脏形状的地图。


即使我们手头只有几百个真实的病人数据,我们也可以在这个“地图”上的空白处进行采样。我们可以让AI生成一个“介于病人A和病人B之间”的新解剖结构。这个新生成的虚拟病人,在现实中可能并不存在,但他在解剖学上是合理的,他在统计学上是符合人群分布的。
通过这种方式,我们可以快速生成成千上万个具有统计学代表性的虚拟病人模型(Cohort Level)。然后,利用我们的神经代理模型,在几分钟内对这几千个虚拟病人完成植入物仿真。
这就是“计算机模拟临床试验”(In-silico Clinical Trial)的未来。我们不再是去寻找病人来测试设备,我们是在创造虚拟的众生来验证科学。这不仅能极大地降低研发成本,更重要的是,它能让我们在产品上市前就发现那些罕见的解剖结构可能带来的风险,从而拯救生命。


总结一下我们的旅程。通过融合参数化和非参数化AI,我们正在把产品开发周期从“周”这个单位,变成“分钟”。

但这不仅仅是关于速度。更是关于“广度”和“信度”。

广度在于,我们打破了数据的壁垒,让任何历史数据库都能成为训练的燃料。
信度在于,我们没有抛弃物理学,而是把牛顿、欧拉和纳维留下的智慧,深深地刻在了神经网络的基因里。我们让AI不再是一个只会猜谜的黑盒子,而是一个懂物理、守规矩的数字工程师。
我相信,非参数化的、基于物理的AI,将把精准医疗带向一个全新的高度。



Nicolas Pecuchet:Jing,非常精彩的演讲。这里展示的技术深度令人印象深刻。我有一个关于预测能力的问题。在多参数或多物理过程的设计中,我理解潜在空间可以生成匹配全3D DNS(直接数值模拟)的机器学习解。
但是,如果我放入的是一段历史,本质上是一个具有时间依赖性的过程,从时刻0到最终时刻。如果我把预测的时间点固定在时刻t。通过这套流程,你是否能够信任它产生的预测,不仅是验证当前状态,而是去预测t加上未来某个时间的状况?换句话说,这个机器学习模型能否不仅做验证,还能做‘天气预报’式的未来预测,并回头检查它是否匹配我们已有的物理仿真时间序列?”


Jing Bi博士:这是一个非常深刻的问题。这触及了我们技术栈的核心。简单来说,答案是肯定的,但这取决于我们具体使用哪种技术架构。

你知道,我们并不是只有一把锤子。我们提供多种不同的神经网络架构来处理非参数化AI案例。
对于某些问题,如果只是在这个时间段内插值,我们可能会使用基于图(Graph-based)的方法。但对于你提到的这种时间序列预测,或者说‘外推’(Extrapolation),我们有更强大的武器。
比如,我们正在使用基于Transformer的架构,以及长短期记忆网络(LSTM)的变体。特别是对于流体动力学或瞬态结构响应,我们会使用自回归(Auto-regressive)模型。这意味着模型会读取过去的时间步作为输入,预测下一个时间步,然后把预测结果再喂给自己,不断向前推演未来。



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2026-1-28 09:16 , Processed in 0.080709 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表