医疗大模型激战

寂静回声 · 发表于 2024-9-1 15:23:53

市场对医疗大模型的乐观情绪，可以找到不少数据支撑。
MarketsandMarkets预测，到2025年，全球医疗大模型市场规模将达38亿美元，到2030年将超过100亿美元。
另据IDC，2023年中国医疗软件系统解决方案市场规模为206亿元，预计2028年将达358亿元，对应复合增速为11.7%。
但现实中，医疗大模型厂商仍未找到可行的商业化路径。
排队几个小时后，患者焦虑地倾述病情，医生却忙着埋头写病历，双方几乎无交流，全程就诊不过5分钟，这是国内医院常见的场景。
患者埋怨医生不上心，医生也有自己的苦衷。本着颠覆医疗进场的大模型厂商，要生成一份优质的电子病历，也得经过长时间的摸索。
最初入场的玩家，以深耕医疗产业的公司为主。它们有的是数据，但缺乏技术，所以其大模型底座多数源自互联网大厂的通用开源大模型。
早在2023年2月，互联网医疗平台微脉就依托百度文心一言，深化了全病程管理业务。
3个月后，被称为国内首款医疗大模型MedGPT发布，由医疗互联网企业医联在ChatGPT的基础上，加工而成。
这种办法虽然能省去大量的时间和成本，但产品不够精细，业务场景单一，容易出现“幻觉”，而医疗的容错率近乎为零。
所以，即便此时市场上医疗大模型数量并不少，智云健康、润达医疗、东软、叮当健康等医疗公司，深圳市大数据研究院、上海人工智能实验室等研究机构，都发布了各自的医疗大模型，但掀起的水花有限。
等到当年9月，百度和腾讯正式下场，发布了自研医疗大模型产品，才让行业真正看到大模型在医疗的应用潜力。
百度灵医大模型为例，聚焦在智能健康管家、智能医生助手、智能企业服务三大方向，具备生成结构化病历、文献解析、实时辅助医生确诊疾病等功能。
百度曾公开表示，灵医大模型的测试结果为接近三甲医院的主治医生。今年4月，灵医大模型通过网信办备案，获得官方认可。
无论是腾讯还是百度，他们都有自研通用大模型，都有自己的医疗互联网平台，既有技术，又有海量医疗数据，还能触达线下医疗场景，各种优势加持之下，能把产品磨合得更精细。
产品有了，厂商便迅速转向医院争夺战，推动规模化的商业落地。各区域的顶尖医院，成了香饽饽。
据不完全统计，单是四川大学华西医院，就跟科大讯飞、百度健康、商汤科技医疗均有合作。
一方面，华西医院是国内排名前10的顶级医院，影响力大，且医疗数据非常优质。另一方面，华西医院对AI新技术的开放程度高，主动拥抱“AI+医疗健康”的风口。对于大模型而言，这无疑是推动规模化落地的极好练兵场。
医院同时押注多家厂商，厂商也不会把“鸡蛋都放在一个篮子里”。
除了华西医院，百度健康还与武汉协和医院、华中科技大学同济医学院附属协和医院、山东大学第二医院等建立了合作关系。
7月的上海世界人工智能大会上，商汤医疗宣布，与包括瑞金、华西、新华、西京、中科大附属第一医院等头部医院启动智慧医院建设示范样板，帮助医院建立“中枢大脑”，实现对智慧医院建设的底层赋能。
经过一年多的探索，医疗大模型几乎已贯穿院前、院中、院后全流程，从智慧导诊、医生推荐、预问诊，到医患对话、病历自动生成，再到报告解读、康复管理、档案流转等。在厂商讲述的故事中，大模型并非取代医生，而是极大地减少医生的重复性劳动，释放了大量的外围同质化工作。某种程度上，大模型重新分配了医疗资源。

尽管AI技术确实给医疗行业带来新的气象，但看病痛点并没得到根除，大模型仍只是众多辅助工具之一。
国外业界持类似的观点。发表在《自然》杂志的研究结果显示，谷歌的医疗大模型Med-PaLM回答的评分高达92.6%，与现实人类临床医生的水平（92.9%）相当。尽管如此，谷歌高管还是泼了一盆冷水。
在6月举办的HLTH Europe 2024会议上，谷歌首席健康官Karen DeSalvo表示，“我不希望大家认为，仅通过建立一个生成式AI大模型，我们就能治愈所有的健康问题和疾病。”
到底谁需要医疗大模型？

百度健康总裁何明科公开表示，医疗是少见的“三位分离”的行业，决策者、付费者和使用者是三个完全不同的主体，分别是医生医院，保险、医保，以及患者。换言之，患者说好，医院才会更愿意尝试。厂商需在C端得到价值认可，从而获得反向与B端进行商业博弈的机会。
AI不是特别新的技术，已改造过一轮互联网医疗平台了，让看病效率有了极大的提升。比如，体验报告解读、智能问诊、健康管理等场景，都被重塑过了，让AI医生助手更聪明。然而，AI没有阻止互联网医疗平台的陨落，C端并不肯买单，转向B端后，也未能焕发新生。
究其原因，患者最关心的永远都是医生资质，而在患者眼里，“AI医生”并不等于实质的医生，他们不会把自己和家人的生命健康，交给充满不确定性的产品。因此，大模型厂商急于抱紧龙头医院的“大腿”，希望通过医院背书，占领用户心智。
此外，厂商目前主要用的是公开数据，缺乏产业级数据，大模型的能力始终存在天花板，更别谈实现真正的商业化。
医院手握病患数据，数量和质量都是互联网巨头难以匹敌的。但医院显然不会轻易把这些数据交出去，这要看厂商能为医院带来什么。
由于医疗资源的核心，也就是医生，没法复制，此前所有试图缓解这个矛盾的努力，都放在设计更好的分流方式，即通过分级诊疗等策略，按照需求分层，区分轻重缓急，来降低医疗压力。
从现有的场景来看，医疗大模型没有跳出这条旧定规则。在限定场景把大模型的能力发挥到极致，其实才是厂商的课题。
例如，比拼把医疗风险降到无限低，这是医院端、医保端、患者端的共同需求。
百川智能也认为，0和1的差异，首要关键不是提升准确率，而是错的那部分确保不会引发生命健康严重风险。“谁能把医疗风险的安全性做得更好，谁才有在牌局上的资格。”

医疗大模型或能在测试关能和医生相媲美，到了临床，情况也许大相径庭。
今年7月末，在科学期刊Nature Medicine上，一篇名为“Evaluation and mitigation of the limitations of large language models in clinical decision-making”（《“评估和减轻大型语言模型在临床决策中的局限性”》）的研究论文引发关注。
该研究发现，即使是目前最先进的大模型，也无法为所有患者做出准确诊断，且表现明显差于人类医生，医生的诊断正确率为 89%，而大模型的诊断正确率仅为73%。在一个极端情况（胆囊炎诊断）下，大模型正确率仅为13%。
更令人惊讶的是，随着对病例信息的了解增多，大模型的诊断准确度反而会降低，有时甚至会要求进行一些可能对患者有严重健康风险的检查。

曾参与医疗大模型Med-PaLM 2训练的谷歌高管Greg Corrado表示，“在医疗领域AI可以带来好处的环节，它能创造10倍的价值”。
但当谈到家人时，Corrado话锋一转，“我并不觉得这种技术现在已达到我愿意让家人使用的程度”。
既然大模型技术没先进到颠覆，医院势必会三思而行。何况，还有高昂的部署成本摆在眼前。进口的芯片（GPU）价格高，且货源紧张。哪怕是国产GPU，硬件成本也至少得几十万。

		自动登录	找回密码
密码			立即注册

医疗大模型激战

浏览过的版块