【ITBEAR】
在一次线上图文问诊中,由于患者首次上传图片模糊,中国医科大学附属第一医院皮肤科郭昊医生初步判断为患者病症为色素痣,当他准备进行下一步建议时,智能医助弹窗提醒“考虑诊断扁平疣可能性是90%,色素痣可能性是60%”,郭昊犹豫片刻后让患者提供了几张更清晰、多角度的照片,最终确诊为扁平疣。
诸如此类的AI技术辅助诊断场景正越来越普遍,医疗行业也已成为当下行业大模型集中落地和未来最有潜力的领域之一。
AI大模型由于其自然语言理解和逻辑推演的优势,在交互场景丰富和数据量庞大的领域有着天然优势,医疗行业便是如此。据Global Market Insights 报告预计,“AI+医疗”市场规模年均复合增速将超过 29%,2032年将达到700亿美元。IDC预计,到2025年,全球人工智能应用市场总值将达1270亿美元,其中医疗行业将占总规模的五分之一。
然而,千亿蓝海市场的乐观预计背后,现实是包括医疗行业在内,大模型的商业落地都还没有走出一条成熟路径。尤其对于专业性极强、容错率极低的医疗领域,大模型距离真正打开局面还早。
千亿蓝海
在千亿级医疗领域AI技术应用前景诱惑下,国内医疗大模型层出不穷。从应用来看,除了常见的诊疗全流程、深度学习加持多年的医学影像,还有中医康复这类冷门但有潜力的场景。
在能力上,AI大模型在医疗行业的作用主要体现在三方面:一,提升医疗工作者的工作效率,以及改善医疗资源不平衡的问题;二,降低患者在医院候诊、诊疗的时间,提升就医体验;三,提升研发新药的效率、降低研发成本。
“原本每天能审阅50张CT片子,未来每天能审阅500张/天,那么医疗效果的提升,将让患者的就医体验,以及医生的工作体验都得以改善。”IEEE标准协会新标准立项委员会副主席兼IEEE数字金融与经济标准委员会主席林道庄曾对表示,现阶段,中国医疗资源比较紧缺,许多人排了很久的队才能看上病,而医生也很忙,通过大模型的辅助,能帮助医生快速的识别诸如X光片、CT等病历,从而大幅提升医生工作效率,也能降低患者等待的时间。
从资本的角度出发,虽然目前医疗行业大模型仍处于发展的初期阶段,但资本市场对于大模型在医疗行业的商业化还是持有较乐观的态度。今年以来,医疗相关的大模型获得融资的案例并不少,国内唯一一家专注医疗的头部大模型公司百川智能,获得了50亿A轮融资,正在以200亿元开展B轮融资。其自研的通用医疗增强大模型,已在多个权威评测中超越了GPT-4;生物医药大模型公司“水木分子”完成近亿元融资,成立仅一年,由清华大学智能产业院AIR于2023孵化,主要从事生物医药行业基础大模型研究,并开发了对话式药物研发助手工具ChatDD。
从参与主体来看,互联网厂商和科技公司为主,比如百度“灵医Bot大模型”、云知声“山海认知大模型”、左手医生“MedGPT/左医GPT大模型”、医渡科技“医渡大模型”、京东健康“京医千询大模型”、腾讯“腾讯健康AI医疗大模型”、华大基因“基因检测多模态大模型GeneT”、讯飞医疗“讯飞星火医疗大模型”等。
除了厂商以外,研究机构与高校也都结合自身经验推出了医疗大模型的产品。比如,浙江大学启真医疗大模型,致力于通过AI技术提升医疗服务水平,据了解该模型可应用于远程医疗、医疗咨询、健康管理和个性化治疗方案定制等领域,并已在多个试点项目中得以应用;四川大学华西医院信息中心则是推出了具备鉴别诊断和病历生成自动生成能力的惠每医疗大模型,该模型适用于临床决策支持系统,帮助医生进行诊断和治疗计划的制定。
相较于通用大模型,医疗大模型作为行业大模型,需要具备足够的专业知识,对于一些规划未来在临床应用的大模型,更要具备充足的、高质量的相关临床数据作为语料,加以训练才能具备专业的能力。国内外主流大模型厂商都在积极寻求医院资源进行战略合作,共同探索可行路径。
例如,京东推出的“京医千询”,整合了大量的临床实践指南、医学文献和专家知识,能快速完成在医疗健康领域各个场景的迁移和学习,并在2023年12月,京东健康就与温州医科大学附属第一医院达成了战略合作,共建“未来医院智慧服务”,打造了全国领先的新一代智慧医院的智慧服务系统。
中科闻歌布局中医赛道,在今年9月发布了“大医金匮”中医大模型,依托中科闻歌全自主产权的雅意大模型,选择了1500余本中医典籍及海量临床医案数据进行训练,解决了中医症状标准化、四诊特征数据对齐、中医临床辨证推理以及诊断与治疗方案可控生成等技术难题,构建了国内首个中医标准化症状知识图谱,以及OTC中药、OTC西药、中药方剂、中医食疗和中医运动处方五大细分知识库。大医金匮在中医执业医师和执业药师模拟考试中准确率也达到85%以上。
中国信通院在10月开展了医疗健康大模型效能评估工作,其调研显示通用大模型在医学知识广度方面具有一定优势,医疗健康行业大模型在特定医疗任务上表现优异。
据悉,此次评估选取了GPT4、GPT-4o等国外通用大模型,文心一言、通义千问、混元和智谱清言ChatGLM等国内通用大模型,灵医Bot、夸克健康助手、讯飞星火医疗大模型和华佗GPT II等医疗健康行业大模型展开效能评估,考察大模型在多学科知识问答、多形式语言理解、多场景文书生成、多环节辅助诊疗、多轮对话交互、多模态支持等六大方向的实际应用效能。
以讯飞星火医疗大模型为例,其在个人画像、健康干预方案、病历文书生成及质控、检验检查报告解读、体检报告单解读、药盒解读等细分任务中表现均处于领先,在健康常识、疾病百科、用药知识、电子病历结构化、专业知识生活化等方向上均展现高度专业性。
分诊助手、辅助决策、病历生成、AI制药.....已涌现诸多场景
“诸如大模型的这类数字技术就像是‘锤子’,而应用像是‘钉子’,场景像是‘墙’,只有找到合适的场景,再用锤子将钉子‘钉’上去,才能实现最后的价值。而没有应用,没有场景,光有技术,这个技术也是没有用的。”东软集团董事长刘积仁在与的对话中曾形象比喻。
以慢性阻塞性肺疾病(简称慢阻肺)为例,这是一种常见的、可预防和治疗的慢性气道疾病,其特征是持续存在的气流受限和相应的呼吸系统症状。在中国约有1亿慢阻肺患者,每年导致约100万人死亡,已成为中国致死率第三高的疾病。
慢阻肺发病时会出现胸闷、呼吸困难等症状,与很多其他疾病具有相似的病症,筛查要通过胸部CT进行,而对于医生而言,解读CT影像给出诊断意见需要消耗大量时间,而对于急性发作的患者来说等报告的时间过于漫长,患者有可能在短时间内有生命危险。
这时候,如果将AI技术应用到CT筛查中,就能够快速对CT影像进行初步解读、筛查出可能是慢阻肺造成的患者不适,医生能尽快干预治疗,从而让患者在发病初期就能得到适当的治疗,降低慢阻肺的死亡率。
东软医疗基于此,与广州医科大学附属第一医院广州呼吸健康研究院合推出肺部CT影像处理软件NeuLungCARE-QA,填补国内通过胸部CT平扫图像筛查慢阻肺的技术空白。
据了解,NeuLungCARE-QA是一款针对慢阻肺筛查的智能辅助分析软件,软件可以通过肺部CT平扫图像的自动分析,输出肺实质分析定量(Quantification定量)与支气管(Air气道)的相关参数,辅助医生进行慢阻肺的早期筛查等临床应用,从而有效推进呼吸疾病“早筛早诊早治疗”的健康行动落实。相较于肺功能检测,CT平扫覆盖面广,且已在基层医院和体检中心普及。因此,在肺癌CT筛查人群中,借助NLC软件即可进一步挖掘受检者的胸部CT平扫信息,帮助尽早发现潜在的慢阻肺患者,将防治前移至无症状期,使患者获益更多。
包含慢阻肺筛查在内,疾病筛查领域已经有不少医疗机构进行积极的尝试。
文章开头列举的皮肤疾病诊断案例来自京东健康,数据显示,京东健康皮肤医院基于大模型的AI辅诊准确率超过95%,皮肤医院开发的专病随访服务患者付费转化率已达20%。
在辅助诊断之外,借由AI的能力,也能在疾病病发之前就及早干预,从而起到预防的作用。
以华大基因为例,前不久其正式发布了面向临床的基因检测多模态大模型GeneT。据华大基因IT副总监梁伦纲介绍,基因检测多模态大模型GeneT是华大基因在AI大模型领域的重大突破。该模型利用超过百万级的高质量数据,构建了百亿级的高质量token,结合解读专家经验,实现了对全基因组数据的精准解读。
据了解,在真实临床样本的测试中,GeneT模型展现出了极高的准确率,能够从数百万个变异位点中快速筛选出与临床表型相关的致病突变,为临床诊断和治疗提供有力支持。
基于基因检测的特殊性(属于垂直行业领域),有些场景下并不需要超大参数规模的模型产品,一些小模型的产品就能够满足生产过程中的需求,“现在,华大基因就采用了一些十几B参数的小模型,”梁伦纲指出,“虽然在训练过程中会比较消耗资源,但投产之后的成本还是非常低的。”
京东健康大模型专家也曾向表示,从目前应用来看,应用成熟度较高的是中体量的模型产品,以京东健康为例,京东健康目前主推的“京医千询”系列模型产品中,应用成熟度较高的是14B和22B的模型产品,主要应该用在非医疗决策方面。
AI大模型在药物研发方面也有着不小的应用空间。在外滩大会上,一位药物研发行业专家公开表示,药物研发目前面临着研发投入越来越高、回报率越来越低的情况,“药物研发也很看重ROI,目前平均的回报率大概在1.8%左右,还不如把钱存起来的利率高。”该专家指出。
以往药物的研发主要依靠研发人员的经验及所学知识进行项目推进,但人的经验和学习能力是有限的,但对于AI大模型而言,可以在短时间内,通过快速的专业知识的积累,就获得具备“行业竞争力”的专家级的知识水平,同时还可以在短时间内推演出药物的基因排序和组合,从而让药物的研发进一步降本增效。
总体来说,虽然大模型在医疗行业中已出现诸多的应用场景,但是从目前的应用现状上看,大模型产品能为医生提供的帮助还是非常有限,其应用场景主要还是集中在一些非医疗决策的方面,更专业的能力有赖于模型产品获取的数据量进一步提升,以及模型能力的优化。
多模态融合也是医疗行业应用大模型未来发展的重要趋势,医疗大模型在文本信息之外,更要融合图像、语音、生理信号灯多种数据源,从而更全面的获得患者信息,以便于做出更准确的诊断。
严肃性、安全性、成本....落地仍面临诸多挑战
AI技术已经开始在医疗行业“大展身手”,但离“独当一面”还早。
比如,AI技术在医疗行业中的应用最终是要落到患者身上,在辅诊方面,大模型应用的门槛是:需要AI产品像主治医生一样,结合不同病人的实际情况,准确的开出相应的治疗方案。而从目前的应用来看,AI技术只能起到部分辅助、协作的作用,最终还需要医生凭借经验制定医嘱。
不仅如此,医疗行业本身就具有严肃性和安全性的特性,即便有很好的场景,应用过程中还是需要特别注意专业严谨性。
“医疗行业的特点是诊疗严肃性和过程不可逆性,这也是AI技术落地的难点所在。”高博医疗集团首席信息顾问陈金雄曾在2024 ITValue Summit 数字价值年会期间指出。
比如,虽然医院电子化、信息化已经有一定的基础,但在选择设备、检查方式的时候,大多数电子设备与传统机械式检查设备相比,精准度仍然有待提升。深圳市第八人民医院信息统计科主任赖伏虎曾在2024 ITValue Summit 数字价值年会期间指出,医护人员在大规模使用无线生理信息采集仪器去病房采集指标,结果可直接传输至电子病历,但医护最终仍要做人工测量,因为医院有一条底线,追求绝对安全。这决定了医院对AI软件和设备的需求很大,挑战也很大。
医疗数据的安全性也非常关键。如何确保患者的数据是“可用不可见”的,一方面,需要监管部门对这部分数据进行监管;另一方面,需要打通医院之间的数据壁垒。
数据也是困扰着医生应用AI技术的一大掣肘。上海某三甲医院主治医师张医生(化名)表示,目前AI工具还都不太成熟,处于数据安全和隐私保护等因素的考虑,目前医生只能看到患者做了什么检查,但是看不到具体的检查结果,“对于我们医生来说,我们希望可以在确保数据安全的前提下,能够看到患者既往的病史、用药等情况,这也有助于我们针对不同病患,制定响应的治疗方案。”张医生如是说。
另一方面,如果AI技术并不能给医生带来效率的提升的话,对于医生而言,AI能为整个诊疗过程提供的价值是有限的。对此,张医生表示,目前通过AI工具是具备给医生提供处方开方建议的能力,但是因为整体医疗时间紧凑,导致医生大多数时候没有过多的时间与AI助手进行交互,最后还是只能依靠自身经验开据药物,“我们普通门诊一上午3个半小时时间内,要看60多个病人,并没有时间去跟AI助手探讨药物的使用问题,大多数时候还是根据我自身经验给患者开药的。”张医生指出。
除了严肃性和安全性的问题以外,对于医疗机构来说,现阶段的大模型产品还达不到足够的降本增效预期,成本(或者说ROI)也是阻碍大模型落地的一个关键点,当前各厂商大模型与医院合作也是从战略考虑。京东健康大模型的一位专家曾告诉,“医院不能因为引入大模型产品,而导致整体的医疗成本和科研成本上升,”该名专家告诉,“这对于医疗机构来说,是不能接受的。”
同样,对于产业链另一头的服务商而言,商业变现也影响着服务商。
刘积仁曾对表示,AI技术当下遇见最大的一个问题就是商业变现,以辅助看片的场景为例,将AI的能力植入到医学诊断软件之中,对于医院来说,如果植入AI能力的软件要比没有AI能力的软件更贵的话,可能很多医院都不愿意为“多出的部分”买单,“因为本身医院就有医生进行片子的审查,多出的部分并没有带给他们实际的价值,而当下AI的能力,对于效率的提升又是有限的,所以很多医院都不愿意为了这部分的软件价值去买单。”刘积仁表示。
东软集团在医疗领域实现大模型变现的经验是,通过自身原本的基础医疗设备,将AI的能力植入到设备中,以整体解决方案的形式对外输出能力,随着医院的应用,再将脱敏后的数据,在可信的状态下对这些产生的数据进行积累,有了数据基础后,再反哺于模型的训练之中,最后再通过训练好的垂直领域专有模型变现。
在大模型和AI技术快速升级的另一面,打造专业领域真正的应用价值,行业大模型的历练才刚刚开始。拐点未至,前路漫长。(本文首发于,作者 | 张申宇,编辑 | 盖虹达)