寂静回声 发表于 2025-4-8 11:34:09

达索系统谈人体虚拟孪生临床试验

本文为《解密人体:2024国际人体虚拟孪生大会》系列的第七篇,主要内容有临床试验监管方面的话题等。


讨论小组汇集了来自FDA、临床实践、研究和行业的领军人物,探讨计算机模拟临床试验的变革潜力。讨论重点是最近发布的“Playbook”,这是一份全面的指南,详细介绍了如何使用虚拟孪生作为监管证据,强调了加速医疗创新、改善患者安全和重新定义临床研究未来的途径。

主持人为达索系统的Jean Colombel,小组成员包括:FDA的Brent Craven;FDA的Kenneth Aycock;波士顿儿童医院的David Hoganson;伦敦大学学院的Claudio Capelli;达索系统的Steve Levine。



专题讨论的主要内容如下:
主持人(让·科伦贝尔,达索系统):感谢大家这么早和我们在欧洲相聚。很高兴你们能来,也许肯尼斯·艾科克和布伦特·克雷文可以先介绍一下自己。
肯尼斯·艾科克(美国食品药品监督管理局):很高兴能和大家在一起。我来自美国食品药品监督管理局(FDA),在医疗器械与放射健康中心(CDR)的科学与工程实验室办公室工作。自从加入这个机构,我就一直在从事计算建模方面的工作,今天很高兴能和大家分享一些相关内容。
布伦特·克雷文(美国食品药品监督管理局):感谢邀请。我在FDA工作了大约10年,也从事计算建模方面的工作。我是计算机建模与仿真的科学顾问,负责协调很多计算建模方面的研究和政策倡议。很高兴能加入这次讨论。

主持人:现在在台上和我一起的,还有我们已经见过的大卫·霍根森博士,以及参与“富集项目”的克劳迪奥·卡佩利博士(伦敦大学学院)和史蒂夫·莱文。我想也许大卫、克劳迪奥和史蒂夫,你们也可以在这个项目的背景下简单介绍一下自己,说说你们在其中所做的工作。
大卫·霍根森(波士顿儿童医院):能参与这个项目是我的荣幸。我是这个项目中的临床方面的参与者之一。开始思考如何将我们在临床领域所做的建模和仿真工作应用到患者护理的不同阶段,也就是人体虚拟孪生临床试验中,这真的很令人兴奋。
从我的角度来看,我认为这项工作在儿科领域可能会产生最大的影响,因为儿科临床试验面临着巨大的挑战,而且开展这些试验所需的资源往往很难获取。所以我们真的很期待这将在儿科器械和技术方面发挥重要作用。
克劳迪奥·卡佩利(伦敦大学学院):大家下午好,我是克劳迪奥·卡佩利。我是伦敦大学学院和英国最大的儿童医院——大奥蒙德街医院的研究员。我和大卫·霍根森的工作领域类似,但在不同方面。


在“富集项目”中,我代表一些学术生物工程团队,和斯旺西大学的桑杰·潘特同事一起工作,努力在我们的研究中搭建起两种建模方式之间的桥梁,一方面是患者-器械相互作用和虚拟队列与临床建模和临床医生之间的联系。这就是我们在这个项目中的角色,为这个出色的团队提供建议并合作。
史蒂夫·莱文(达索系统):在“富集项目”中,我的角色主要是协调项目。这个项目的愿景实际上来自当时CDR的负责人杰夫·树人。他很喜欢这个概念,他认识到(我稍后会分享他的一句话来阐述他的观点)这个项目的重要性。


重要的是,他说:“我希望你们开展这个项目,但不要自己在角落里做研究,然后告诉世界你们做了什么,要带着大家一起做。”这样,当项目结束时,社区中的所有利益相关者都能理解它,知道如何使用它,对它提出质疑,并准备好实施那些可行的部分。
这是一个特别大的挑战,但幸运的是,我们得到了很好的回应。有多达75人在项目的不同部分工作。虽然今天在这里代表项目的只有我们几个人,但在过去的五年里,有多达70人贡献了他们的时间来推动这个我们今天要讨论的领域的发展,他们来自50多个组织。我还想提到,肯尼斯、布伦特和我是这个项目的共同主要研究者。


主持人:那么这个项目是关于什么的呢?我们先来介绍一下这个项目,展示一下它的目标是什么。接下来的5 分钟交给你,肯尼斯。
肯尼斯·艾科克:谢谢大家。我想你们会看到这里的记录。我来自FDA的医疗器械与放射健康中心的科学与工程实验室。我很高兴能和大家分享我们关于医疗器械人体虚拟孪生临床试验可信度评估项目的最新进展。

首先介绍一些背景。在2023年11月,FDA发布了一份最终指南,评估了计算建模和仿真在医疗器械申报中的可信度。该指南提供了FDA目前对用于支持监管申报的建模研究的可信度评估的思路。它建立在ASME VNV 40 2018和之前FDA关于计算建模研究报告的指南基础之上。
该指南还对一些新原则提供了观点,比如依靠临床数据来支持仿真验证,以及使用建模和仿真来推动医疗器械人体虚拟孪生临床试验这个新兴话题。
然而,该指南并没有解决与评估像人体虚拟孪生临床试验这样复杂模型的可信度相关的具体挑战,也没有提供人体虚拟孪生临床试验的例子。

我们的团队在几个咨询委员会的建议下,开发了一个医疗器械人体虚拟孪生临床试验可信度评估的分层框架,最近发表在《医学前沿》上,并且可以在网上公开获取。我现在简要总结一下这个提议的分层可信度评估框架。

我们首先提议将人体虚拟孪生临床试验组织成六个子模型,分别是器械模型、患者模型、器械和患者模型以及预期两者在干预期间的相互作用模型、虚拟队列模型和预期患者间的变异性模型、临床医生模型和预期临床决策的变异性模型以及临床结果模型。
然后,这六个子模型被策略性地组合起来,以模拟一个真实的人体临床试验及其相关的变异性。
首先,器械和患者模型由初始边界条件以及从临床医生和虚拟队列模型计算出的任何其他所需输入变量驱动。然后进行虚拟干预,以随机方式预测基于急性物理的感兴趣量。最后,使用适当的映射模型将这些基于急性物理的量转换为临床结果以及安全性和有效性终点的预测。
需要注意的是,这个框架提议逐步分层地评估可信度,这在很大程度上受到了其他文件(如ASME VN V10)中最佳实践的启发。

通过单独评估每个子模型的可信度,我们可以识别出可能会传播并破坏人体虚拟孪生临床试验预测的错误,从而确保整个人体虚拟孪生临床试验模型能出于正确的原因得出正确的答案。建立人体虚拟孪生临床试验可信度的一个关键挑战是确定应该收集哪些证据来促进规划。


主持人:非常感谢所有参与的人。现在我把时间交给史蒂夫·莱文,听听他的看法。
史蒂夫·莱文:肯尼斯已经很好地介绍了这个项目的主要内容。现在我想从行业和实施的角度再补充一些看法,因为我也是这个项目的主要研究者之一。我不像肯尼斯·艾科克那么聪明,提前录制好他的部分,所以你们得听我现场讲了。


肯尼斯·艾科克很好地强调了我们通过与FDA合作,在那个非常有条理的过程中取得的了不起的成就,让我们明白如何组织信息,以便他们能够实际处理这些信息。我再提供一些背景信息,说说如何使用这些信息。我先分享一句我之前提到的树人博士的话。
我想正如约翰提到的,这张照片是在那次会议上拍的,我相信那可能是在新冠疫情之前FDA的最后一次会议。很可能当树人博士看到他的手机被大量回复轰炸时,他就有了谈论这个具有挑战性的过程以及我们监管方式的动机。他谈到了整个过程,因为他明白监管过程是某个更大事物的一部分,他说这个过程真的过时了,是时候改变世界了。他真的激励我们去思考是否可以重新思考我们将产品推向市场的方式。
我想感谢他的支持,当然也要感谢所有亲自参与和在线参与的人。你们已经多次听到“人体虚拟孪生临床试验”这个术语,很多人知道它的意思。我喜欢把它看作不是一个单一的东西,它在一定程度上取决于你在什么时候进行。



人体虚拟孪生临床试验这个概念有时会让人困惑,“in silico”在拉丁语里是“在计算机中”的意思,但它代表的是一种临床体验,不是在真正的诊所里,而是复制临床体验,实际上就是在患者身上进行。
这可以在三个阶段完成。在你真正接触患者之前的早期阶段,你可以在没有任何临床数据的情况下开始,这是一种很好的方式,可以帮助你确保你正确理解病情和你想要创建的器械。我们今天要讨论的是在临床阶段,这时你至少有一些真实数据来验证和建立可信度,也可能是在上市后阶段,当你实际上想要管理时,就像我们之前听到的,能够用它来指导你的实际治疗。我们要讨论的是这个阶段,当然我们在这个阶段学到的东西可以应用到其他阶段。很抱歉这张幻灯片很拥挤,但这些信息都是可以获取的。


我们有三个委员会的代表,我们组织了一个临床委员会、一个科学咨询委员会和一个行业委员会,以确保我们既有临床视角,能真正代表临床医生会观察到的东西,又有科学咨询委员会来确保我们遵循必要的最佳实践,还有行业委员会来确保我们能够实际实施。
然后我们组建了团队来做所有的事情,随着人们的加入,我们也做了一些调整。最后,正如肯尼斯·艾科克提到的,我们有了所谓的“操作手册”,昨天刚刚作为论文发表和宣布。我们定义了一个逐步的过程,在这个过程中,我们在真实临床试验和人体虚拟孪生临床试验之间建立了一种平行关系。


因为你包括了患者、治疗以及治疗和患者之间的相互作用,在现实世界中所做的和在计算机中所做的之间有一种类比,你可以在每一步建立可信度,这一点很重要,而当你只是在实验室里看一个器械时,你是做不到这一点的,你只是孤立地看一个部分。所以你可以在人体虚拟孪生临床试验中让你的器械通过整个过程,就像在真实世界中并行进行一样。

我们认为这是一个重要的范式。肯尼斯·艾科克也提到了我们做的测试案例。在这个案例中,我们从真实患者开始进行验证。我们使用了由霍根森博士团队处理的数据,你们已经看到了他们在重建人体解剖结构方面的能力。我们去找了那个团队,他们处理了患者数据,我们用这些数据生成了那些患者的虚拟孪生体,这样我们就可以基于真实患者建立这些虚拟孪生体的可信度。
然后这些数据被用来喂养一个人工智能模型,这个模型把非常复杂的全维度心脏3D模型用一种非常快速的人工智能模型表示出来,这样你就可以生成成千上万的模型,因为在那个时候只需要几秒钟,而且它训练得很好,因为人体虚拟孪生模型有大量的信息,不像临床记录那样缺少背后的人体生理学信息。然后这被用来生成一个整个队列,正如肯尼斯·艾科克所说,所有这些都在出版物中有记录。
一旦你有了这个群体,你就可以用它做任何你想做的事情。你可以测试它,看看它是否符合标准,是否符合纳入标准,是否符合成功标准等等。更重要的是,你可以决定你的器械是否会起作用,为什么起作用,或者对谁起作用。



我快速举一个简单的例子。我们选择了一个二尖瓣修复器械作为例子。分析得出的一个结果是,什么样的患者会有反应,什么样的患者不会有反应。这有点详细,我不会深入探讨,但你可以看到成功患者和不成功患者之间的区别。
人工智能可以非常详细地告诉你,在这个例子中,最关键的因素是一个非常复杂的几何比例,这对于放射科医生来说几乎是不可能计算出来的,你必须知道你在找什么才能进行这些测量,而人工智能可以直接从数据中提取出这些信息,这是判断那个患者是否会成功的关键指标。

如果你在设计一个试验或者决定以后是否进行治疗,你可以相应地识别和筛选你的患者。这样你就得到了一个决策树,根据人群来决定你的纳入标准,这就是我们称之为“富集”的原因,因为你可以用可能有反应的患者来丰富你的人群,从而降低你的试验风险,当然也可以为临床护理提供指导,比如这些是合适的患者类型,从而更快地推动器械的采用。还有一些次要影响,我在这里就不详细说了。
最后,当然你会得到一个可以重复使用的人群,因为他们是计算机生成的患者,不像真实临床试验中的患者,你不能让他们回来再次接受测试,而虚拟患者不介意被用于下一代器械的测试。我们通过人体虚拟孪生临床试验提供了所有这些内容。


主持人:现在你已经和观众分享了你所说的“富集”的含义,那么这个项目的核心是什么呢?让我们进一步讨论一下,以便我们可以和大家一起探讨。
第一个问题是问在线的肯尼斯和布伦特的,从你们的角度来看,在确定建立人体虚拟孪生临床试验可信度的标准时,最大的挑战是什么?你们今晚听到了很多关于可信度的内容。布伦特先开始吧。
布伦特·克雷文:谢谢,对我们来说,解决这个问题很有趣。我们试图理解如何评估一个有很多变动部分的模型的可信度,而且最终你要预测的东西可能与物理原理相去甚远,比如要预测临床终点。
我认为最大的挑战是真正知道如何证明整个过程的可信度,以及知道要收集什么证据。在论文中,我们提供了很多指导和一个框架,说明如何组织模型,以及在哪里展示器械的预测是准确的、患者的预测是准确的、队列的预测是准确的,并且所有这些都能正确地结合在一起,以便最终的结果是可信的和可靠的。我们还确定了证据的类型,这在FDA的指南中是新的内容,它可以帮助规划你为支持整个过程而进行的活动。


肯尼斯·艾科克:我代表可信度评估团队说一下。史蒂夫给你们展示了那个有所有不同团队的图表。当我们刚开始研究可信度评估时,这是极其具有挑战性的。有太多相互交织的不同部分,它们都会影响可信度。
我认为最初最大的挑战就是如何处理一个有这么多相互交织部分的人体虚拟孪生临床试验的可信度问题。后来我们想到把人体虚拟孪生临床试验分解成不同的子模型,就像我之前描述的那样,然后分别验证和确认每个子模型,这样我们就可以确信从模型的一个部分到另一个部分的输出是准确的,来说真的是一个顿悟的时刻,让我们知道如何进行可信度评估。
这在我看来是最大的挑战。用二尖瓣的例子来展示如何通过数据来建立每个不同组件的可信度也是一个挑战。但总的来说,我认为这将是一个很好的例子,可以推动这个新兴技术的发展。

主持人:有很多丰富的内容和多样性。也许现在我想问一下台上的大卫医生,人体虚拟孪生在哪些方面能提供超越传统临床试验的见解呢?你对此有什么看法?
大卫·霍根森:我认为这里既有很多机会,也有很多挑战。人体虚拟孪生临床试验可以对某些血液动力学参数做出非常精确的预测,比如在我们建模的心脏器械方面。
但正如肯尼斯·艾科克和布伦特所说,将其转化为FDA要求的终点是很困难的。在2020年我们开会时,FDA非常明确地表示,他们不会改变器械所需匹配的临床终点,也就是模型得出的结果要与实际临床试验的临床终点相匹配。
所以我认为在我们考虑让器械真正通过人体虚拟孪生临床试验时,如何进行这种转化是非常重要的,既要从模型中提取对理解器械结果重要的相关数据,又要将这些数据转化为FDA在器械试验中要测量的临床结果。我认为这些是我们在整个过程中学到的重要内容,也是我们在为真正的器械进行这项工作时要应用的。

主持人:史蒂夫,在你的介绍中你提到了75个项目成员,这么多不同的人参与到这个项目中。我们从中学到了什么呢?你认为人们从中学到了什么,这又会把我们引向何方呢?
史蒂夫·莱文:在这个领域,不同学科的融合是一个反复出现的主题。让不同学科的人聚集在一起真的帮助我们认识到了挑战,无论是在医学、工业、科学还是监管方面,甚至我们了解到在监管的大框架下也有不同的责任,比如统计分析、科学可信度、领域专家等。
我们学会了从多个角度评估一个问题。正如我们之前提到的,信息的虚拟化使得人们能够以一种文件无法做到的方式共享数据。
目前的试验信息通常是封闭在文件中的,创建一个开放系统创造了一种对话,使得人们能够跨学科更有效地解释数据。我们在疫情期间进行了这个项目,在那次面对面会议之后,就再也没有人面对面开会了。如果没有虚拟化的能力,我们是不可能完成这个项目的。



主持人:在我们进行伦理讨论之前,我也在想这个问题,人体虚拟孪生临床试验如何解决涉及人类受试者的临床试验中的伦理问题呢?这又引入了哪些新的伦理考虑呢?也许肯尼斯,你想说几句吗?
肯尼斯·艾科克:我会从我的角度来说说,我不是临床试验伦理方面的专家,但我认为有几个关键要点需要考虑。
一方面,这确实是一个很好的机会,可以解决收集某些人群数据的问题,这些人群我们原本可能无法研究。有些临床试验可能因为伦理原因无法进行,可能很难预先评估风险和收益,以至于无法证明启动试验是合理的,可能风险太大或者收益太不明确,也可能有些患者人群很难招募。
人体虚拟孪生临床试验为我们提供了一个机会和途径来获取我们原本无法收集的数据,如果我们可以使用模型来研究这些边缘案例和人群,而不会让任何人处于风险之中,那是非常了不起的。
另一方面,进行人体虚拟孪生临床试验也有一些伦理考虑和可能引发的担忧。一是需要确保用于校准或验证这些模型的任何数据的隐私得到妥善处理。
要建立、校准和验证模型需要大量的数据,包括大量的实验室数据和患者数据。在收集这些数据时,可能需要收集一些通常不属于典型干预的类型的数据,比如更高分辨率或时间分辨的成像数据,可能还涉及一些剂量问题,必须确保这些风险得到妥善缓解,不能让患者为支持启动人体虚拟孪生临床试验而承担额外风险。
最后,归根结底还是人体虚拟孪生临床试验的可信度问题。我们希望确保有证据表明我们可以信任这个试验,不会基于可能有局限性并可能导致错误决策的计算模型做出决策。但总的来说,如果我们能妥善利用这项技术,其好处是巨大的。



主持人:也许有一些关于生物医学工程方面的问题。克劳迪奥,首先问你,在开发人体虚拟患者模型方面,关键的技术创新是什么?这可能会有哪些更广泛的影响呢?
克劳迪奥·卡佩利:这是最令人兴奋的部分之一,鉴于我的生物医学工程背景以及我对“富集项目”活动的密切关注。如今我们在谈论合成人群、合成数据或虚拟队列等等,但这其实就是患者的数字表示。在“富集项目”中,挑战在于创建能够真实反映具有特定病理的多个患者特征的人群,这些患者可能会被纳入实际临床试验中。
这说起来容易,想象起来也容易,但实际操作起来却非常复杂。其复杂性主要体现在多个方面。我们想要输入的数据很复杂,它们来自真实的临床场景。有时候临床或医学输入与结果之间的关系是线性的,这还好,但有时它要复杂得多,有时甚至是未知的,而且输入之间可能存在很多关联和相互关系。所以这是一个非常复杂的过程。
我想说最大的进步是(很多功劳要归于整个团队,特别是汤姆和珍,他们在创建虚拟队列的这个特定方面做了很多工作)真正将其付诸实践。他们通过从文献和临床世界获取数据,创建了一个非常基于物理的有限元模型,用替代模型丰富了这种可能性,用这些数据训练替代模型,然后扩大并最终生成了一个非常大的人群。
重要的是(我这里只是简要概括),他们还添加了筛选信息,以确保虚拟患者队列始终保持真实。从监管角度来看,这显然极其重要。我们需要有检查点,在整个过程中评估其可信度,并确保这个过程的一些结果与总体目标一致。我认为我们在这个过程中学到了很多,希望这将影响这个领域的工作者。



主持人:你提到了基于物理的模型。基于物理的模型的一个优势是其模型输入和输出的透明度。在这个项目中使用了人工智能,史蒂夫,我相信你会有兴趣说一说,在“富集项目”中,人工智能是如何帮助创建虚拟队列和预测临床结果的呢?
史蒂夫·莱文:这当然是一个非常重要的话题,原因有很多。我们都听说了很多关于人工智能和大型语言模型的事情。从一开始我们就在这些模型中使用人工智能。
我们认识到,在很多方面,这些人体虚拟孪生用计算机的语言表达比用人类的语言表达更好。计算机不需要把它拆开或者移动它来理解发生了什么,所有这些信息都能被人工智能很好地处理。与很多大型语言模型的训练不同,这里有一个闭环。
我们可以回去测试,当我们用实际人类进行训练时,我们不一定知道它是否正确,但在这里我们可以检查。我们可以说,如果我给它这个,我的替代模型是否能给我正确的答案?我们可以比较人类、人体虚拟孪生和人工智能。



主持人:布伦特,你一直在谈论FDA在2023年11月发布的指南,以及2024年的人体虚拟孪生临床试验“富集”出版物。你会如何描述FDA对将虚拟患者数据纳入监管过程的开放态度呢?
布伦特·克雷文:我想说我们对此非常开放。人体虚拟孪生临床试验在我们新的FDA模型可信度指南中被明确列为一种监管证据形式。
在这个“富集项目”中,我们刚刚发表的论文就是遵循了这个新指南,提供了一个如何将该指南应用于人体虚拟孪生临床试验的例子。
话虽如此,我们虽然很开放,但在论文中我们也强调了进行模型可信度评估的挑战。例如,每当进行人体虚拟孪生临床试验时,通常都需要解决一些挑战,就像霍根森博士指出的,预测与临床试验中通常看到的相同的临床终点就是一个主要挑战。
但总的来说,我认为我们非常开放,而且现在有很多关于如何做的文档资料。



主持人:我想现在是时候结束了。我们已经进行了很多讨论,我们本可以在这里再待一个周末,但现在到时间了。也许每个人用一句话来说说,参与“富集项目”如何改变了你对人体虚拟孪生模型在创新生命周期中的作用的看法?
史蒂夫·莱文:对我来说,在我参与的这五年里改变的不是人体虚拟孪生临床试验的作用,而是FDA的作用。他们从(我不想说固执,但)一个推动者变成了现在的样子,这真的要归功于团队的领导。
他们认识到了重要性和挑战,并发挥了领导作用。我认为这对这个领域是一个重要的信息,是时候接受谢伦博士的话并改变世界了。
克劳迪奥·卡佩利:在参与这个项目之前,我显然已经是一个相信和采用相关技术的人,但这个项目让我再次聚焦于过程,特别是在这些年里一直困扰我的映射问题,即我们如何将仿真结果与临床结果联系起来。这可能是最大的挑战,也是最吸引人的地方。
大卫·霍根森:我的背景是医疗器械,后来成为了一名医生。我认为仍然非常令人兴奋的是,医疗器械的人体虚拟孪生开发(就像我们开发汽车和飞机一样)真的可以加速,而且人体虚拟孪生临床试验的结合,你可以想象一个世界,器械可以从概念快速进入临床使用。
历史上,从概念到初步临床批准的生命周期大约是10年,这对那些真正需要它们的患者群体来说真的很长。所以我认为缩短这个时间跨度并让器械更快地到达患者手中的愿景是一个巨大的承诺,而且我认为这将会实现。
肯尼斯·艾科克:这个项目真的让我大开眼界。我学到了很多关于执行传统临床试验的困难,看到了这个过程中有多少障碍。这凸显了这项工作的潜在影响范围是巨大的。
能接触到所有的合作者、他们的研究和他们工作的不同领域,以及与这么多人建立联系,听到正在开发的各种模型,看到霍根森博士和其他所有人的工作,真的很棒。我认为随着我们为如何进行奠定了这样的路线图,会有很多令人兴奋的事情即将到来。
布伦特·克雷文:在我看来,“富集项目”在很大程度上使以前还比较概念化的人体虚拟孪生临床试验变得更加实用和可行。特别是在可信度评估方面,这个项目真的为如何在实践中进行人体虚拟孪生临床试验以及如何证明其可信度奠定了基础。我认为这将是我们做出的最重要的贡献之一。


主持人:我认为这绝对开辟了一条新的道路。我在这里看到了你们所取得的成就,这绝对是迈向未来个性化医疗下一阶段的关键里程碑,也是我们如何更好地照顾患者的关键里程碑。
我真的非常感谢所有的小组成员,无论是远程参与的还是在这里的,还有那75位我们无法一一列出但为这个项目做出贡献的人。这真的是一次奇妙的合作之旅,现在让我们充分利用它。

页: [1]
查看完整版本: 达索系统谈人体虚拟孪生临床试验