发布:2026-04-19 浏览:7 次
试想这样一个场景:一位患者因持续头痛而接受了脑部MRI检查,扫描完成后,他却需要等待数天甚至一周才能拿到放射科医生的正式报告——对于可能存在的严重病变,每一分每一秒都是煎熬。这种漫长的等待并非个例,而是全球医疗系统面临的普遍困境。随着人口老龄化和健康意识的提升,全球每年进行的MRI检查已接近1亿次,其中20%至30%为脑部扫描。然而,放射科医师的增长速度远远跟不上影像数据的激增,过度的工作负荷导致报告积压、医生倦怠,甚至增加了误诊风险。在偏远地区和低收入国家,这一问题尤为严峻。面对这一挑战,人工智能被视为破局的关键。但以往的大多数AI模型只能在经过严格预处理的“干净”数据集上工作,难以适应真实临床场景中因设备型号、扫描协议、患者群体不同而产生的复杂多变情况,因而迟迟无法真正落地。
2026年2月,Nature Biomedical Engineering(IF=26.6)发表的一项题为"Learning neuroimaging models from health system-scale data" 的突破性研究带来了转机。来自密歇根大学的研究团队成功开发出名为Prima的视觉语言基础模型,该模型以超过22万例真实临床脑部MRI为训练基础,在短短几秒钟内完成对一项脑部MRI研究的全面解读。在涵盖肿瘤、炎症、感染、血管病变等52类放射学诊断任务中,Prima的平均准确率(AUROC)达到90.1%,其中对Dandy-Walker畸形等疾病的诊断准确率更是高达98.5%——这意味着,在几秒钟内,AI就能给出堪比资深放射科医师的诊断结论。
图1:UM220K MRI数据集及Prima工作流程概览
研究团队从医疗系统PACS中获取22万余例脑部MRI及对应报告,利用GPT-4自动标注52类诊断标签。Prima采用分层视觉Transformer架构,先通过VQ-VAE将3D MRI压缩为体积token,再经序列Transformer和研究Transformer逐步提取特征,最终与经大语言模型总结的文本报告进行对比学习,实现多模态对齐。
团队首先依托密歇根大学医疗系统,构建了迄今最大的神经影像数据集UM220K。该数据集包含从20多年前放射学数字化至今的全部脑部MRI研究,共计超过22万例、560万个序列和3.62亿张图像切片,真实反映了三级医疗中心所面对的多样化患者群体和疾病谱。为克服海量数据手工标注的局限,研究者利用GPT-4对每份放射学报告进行自动标注,经专家验证平均准确率达94.0 ± 1.1%,实现了高质量“银标准”标签的规模化生产。Prima的核心创新在于其专门为3D MRI设计的分层视觉Transformer架构。面对3D MRI庞大的数据量,模型首先通过一个3D矢量量化变分自编码器(VQ-VAE)将每个MRI序列分割为32×32×4的子体积,并压缩为仅保留关键诊断信息的“体积token”,实现了16倍的高效压缩。随后,一个序列Transformer(ViTseq)负责处理每个序列的全部token,同时利用序列的文本描述(如“T2 FLAIR”)作为提示,引导更精准的特征提取。最后,研究Transformer(ViTst)汇总所有序列信息,输出整个MRI研究的统一特征向量。通过对比学习,这一视觉特征与经GPT-3.5总结的简洁放射学报告在特征空间中对齐,确保模型学到最具诊断价值的影像特征。
在一项为期一年、涵盖近3万例MRI的前瞻性全医疗系统验证中,Prima展现出令人瞩目的性能:其诊断准确率极高,在52项放射学诊断任务中平均AUROC达到90.1±5.0%,其中对Dandy-Walker畸形等疾病的诊断准确率高达98.5%,显著优于OpenAI CLIP、Med-Flamingo等现有模型,且性能随训练数据量增加持续提升,呈现基础模型的“扩展定律”特性;读片速度极快,在单张L40S GPU上每秒可处理超过6.5个MRI研究,单个复杂序列的分析与诊断推断仅需不到0.15秒,真正实现“秒级读片”;同时具备实用的临床辅助功能,可自动对检查进行优先级排序(与临床实际优先级的相关系数达0.69),并能根据影像特征推荐转诊至神经外科或神经内科,转诊建议的AUROC分别达85.1%和89.1%,有效优化工作流程;此外,Prima提取的特征具有强大的可迁移性,在自闭症谱系障碍、痴呆症等训练时未曾见过的任务上,仅利用其特征训练简单分类器即可在ABIDE、ADNI等公开数据集上取得与全监督模型相当甚至更优的结果,充分证明了其高度通用性。
图2:Prima性能概览
模型的可解释性是临床信任的基石。研究利用局部可解释模型(LIME)对Prima的决策过程进行可视化,发现模型能精准定位MRI图像中的病灶区域用于支持诊断。在公开的脑肿瘤数据集BraTS上,Prima分配的Top-3重要体积token命中专家标注肿瘤区域的准确率高达98.0%。无论是低级别胶质瘤的恶性转化、脑脓肿消散还是分流管故障导致的急性脑积水,Prima的注意力区域始终与临床关注的病变区域高度一致。
图3:Prima的可解释性案例。
除了性能,研究还深入探讨了医疗系统偏见与算法公平性。他们发现,农村地区患者、周末检查患者的报告周转时间显著更长,存在系统性不公平。然而,Prima在所有敏感属性组(地域、种族、性别、医保类型)中均表现出稳定的诊断性能和极小的真阳性率差异,证明其能够缓解而非放大现有医疗不公。
这项研究首次证实,利用医疗系统级别的真实世界数据,可以训练出一个通用、高效、可解释且公平的神经影像AI基础模型。Prima的问世不仅为应对放射科医师短缺、提升诊疗效率提供了切实可行的方案,更展示了“医疗系统即数据引擎”理念在驱动下一代医学AI中的巨大潜力。
正如研究者所言:“Prima exemplifies the transformative potential of integrating health systems and medical foundation models to improve healthcare.”未来,该框架有望拓展至CT、超声等模态,并整合基因组学数据,为精准医疗开辟全新路径。
参考文献
Lyu, Y., Harake, S., Chowdury, A. et al. Learning neuroimaging models from health system-scale data. Nat. Biomed. Eng (2026). https://doi.org/10.1038/s41551-025-01608-0
资讯来源
https://medicalxpress.com/news/2026-02-ai-brain-mris-seconds-accuracy.html
编译:万家利
审核:富柄淇