说起 AI for Science,可能大家首先会想到累累硕果,例如 Alphafold3、Evo2 等工具可以预测几乎所有生命分子的结构、功能,GNoME 可以发现 220 万种新晶体……这些成果代表了 AI 在科学领域应用的进步历程。
但是,这些成果有没有被夸大报道呢?抛开理论,人工智能在现实世界中的实践效果究竟如何呢?
故事的主人公名叫 Nick McGreivy,去年刚刚在普林斯顿大学(Princeton University)获得博士学位,是一名物理学家。
他曾经对热衷于用「AI 加速物理学」,并因此将研究课题的重点转向了机器学习领域。但是,当他尝试将 AI 技术应用于实际物理问题时,结果却令他大失所望。与大家第一次尝试 ChatGPT 等聊天机器人得到智障答案时的反应不同,Nick 认真分析总结了他用 PINN 求解偏微分方程时所得到教训,并深入探究了这件事背后容易被人忽略的一些方法论错误,同时对这些错误可能存在的科学研究场景进行了分析,最终给出了一些结论。
把这些结论翻译成人话就是:人工智能在科学界广泛使用,更多是“科学家受益”而非“科学受益”,加上研究者的论文往往报喜不报忧,存在大量幸存者偏差,导致这个领域像“朋友圈精修图”,光鲜成果背后藏着被滤镜过滤的失败和过度美化的期待。
根据一些备受瞩目的论文,人工智能求解纳维-斯托克斯方程的速度比标准数值方法快几个数量级。然而,我最终发现,这些论文中使用的基线方法并非目前最快的数值方法。当我将人工智能与更先进的数值方法进行比较时,我发现人工智能并不比更强的基线方法更快(或者最多只是略快一点)。
图示:当将用于解决 PDE 的 AI 方法与强基线进行比较时,无论 AI 具有何种狭义的优势,通常都会消失。