Nature子刊：新发现！AI模型能够在几秒钟内读取大脑核磁共振成像，准确率高达97.5%-杭州脑海科技有限公司

试想这样一个场景：一位患者因持续头痛而接受了脑部MRI检查，扫描完成后，他却需要等待数天甚至一周才能拿到放射科医生的正式报告——对于可能存在的严重病变，每一分每一秒都是煎熬。这种漫长的等待并非个例，而是全球医疗系统面临的普遍困境。随着人口老龄化和健康意识的提升，全球每年进行的MRI检查已接近1亿次，其中20%至30%为脑部扫描。然而，放射科医师的增长速度远远跟不上影像数据的激增，过度的工作负荷导致报告积压、医生倦怠，甚至增加了误诊风险。在偏远地区和低收入国家，这一问题尤为严峻。面对这一挑战，人工智能被视为破局的关键。但以往的大多数AI模型只能在经过严格预处理的“干净”数据集上工作，难以适应真实临床场景中因设备型号、扫描协议、患者群体不同而产生的复杂多变情况，因而迟迟无法真正落地。

2026年2月，Nature Biomedical Engineering（IF=26.6）发表的一项题为"Learning neuroimaging models from health system-scale data" 的突破性研究带来了转机。来自密歇根大学的研究团队成功开发出名为Prima的视觉语言基础模型，该模型以超过22万例真实临床脑部MRI为训练基础，在短短几秒钟内完成对一项脑部MRI研究的全面解读。在涵盖肿瘤、炎症、感染、血管病变等52类放射学诊断任务中，Prima的平均准确率（AUROC）达到90.1%，其中对Dandy-Walker畸形等疾病的诊断准确率更是高达98.5%——这意味着，在几秒钟内，AI就能给出堪比资深放射科医师的诊断结论。

图1：UM220K MRI数据集及Prima工作流程概览

研究团队从医疗系统PACS中获取22万余例脑部MRI及对应报告，利用GPT-4自动标注52类诊断标签。Prima采用分层视觉Transformer架构，先通过VQ-VAE将3D MRI压缩为体积token，再经序列Transformer和研究Transformer逐步提取特征，最终与经大语言模型总结的文本报告进行对比学习，实现多模态对齐。

团队首先依托密歇根大学医疗系统，构建了迄今最大的神经影像数据集UM220K。该数据集包含从20多年前放射学数字化至今的全部脑部MRI研究，共计超过22万例、560万个序列和3.62亿张图像切片，真实反映了三级医疗中心所面对的多样化患者群体和疾病谱。为克服海量数据手工标注的局限，研究者利用GPT-4对每份放射学报告进行自动标注，经专家验证平均准确率达94.0 ± 1.1%，实现了高质量“银标准”标签的规模化生产。Prima的核心创新在于其专门为3D MRI设计的分层视觉Transformer架构。面对3D MRI庞大的数据量，模型首先通过一个3D矢量量化变分自编码器（VQ-VAE）将每个MRI序列分割为32×32×4的子体积，并压缩为仅保留关键诊断信息的“体积token”，实现了16倍的高效压缩。随后，一个序列Transformer（ViTseq）负责处理每个序列的全部token，同时利用序列的文本描述（如“T2 FLAIR”）作为提示，引导更精准的特征提取。最后，研究Transformer（ViTst）汇总所有序列信息，输出整个MRI研究的统一特征向量。通过对比学习，这一视觉特征与经GPT-3.5总结的简洁放射学报告在特征空间中对齐，确保模型学到最具诊断价值的影像特征。

在一项为期一年、涵盖近3万例MRI的前瞻性全医疗系统验证中，Prima展现出令人瞩目的性能：其诊断准确率极高，在52项放射学诊断任务中平均AUROC达到90.1±5.0%，其中对Dandy-Walker畸形等疾病的诊断准确率高达98.5%，显著优于OpenAI CLIP、Med-Flamingo等现有模型，且性能随训练数据量增加持续提升，呈现基础模型的“扩展定律”特性；读片速度极快，在单张L40S GPU上每秒可处理超过6.5个MRI研究，单个复杂序列的分析与诊断推断仅需不到0.15秒，真正实现“秒级读片”；同时具备实用的临床辅助功能，可自动对检查进行优先级排序（与临床实际优先级的相关系数达0.69），并能根据影像特征推荐转诊至神经外科或神经内科，转诊建议的AUROC分别达85.1%和89.1%，有效优化工作流程；此外，Prima提取的特征具有强大的可迁移性，在自闭症谱系障碍、痴呆症等训练时未曾见过的任务上，仅利用其特征训练简单分类器即可在ABIDE、ADNI等公开数据集上取得与全监督模型相当甚至更优的结果，充分证明了其高度通用性。

图2：Prima性能概览

模型的可解释性是临床信任的基石。研究利用局部可解释模型（LIME）对Prima的决策过程进行可视化，发现模型能精准定位MRI图像中的病灶区域用于支持诊断。在公开的脑肿瘤数据集BraTS上，Prima分配的Top-3重要体积token命中专家标注肿瘤区域的准确率高达98.0%。无论是低级别胶质瘤的恶性转化、脑脓肿消散还是分流管故障导致的急性脑积水，Prima的注意力区域始终与临床关注的病变区域高度一致。

图3：Prima的可解释性案例。

除了性能，研究还深入探讨了医疗系统偏见与算法公平性。他们发现，农村地区患者、周末检查患者的报告周转时间显著更长，存在系统性不公平。然而，Prima在所有敏感属性组（地域、种族、性别、医保类型）中均表现出稳定的诊断性能和极小的真阳性率差异，证明其能够缓解而非放大现有医疗不公。

这项研究首次证实，利用医疗系统级别的真实世界数据，可以训练出一个通用、高效、可解释且公平的神经影像AI基础模型。Prima的问世不仅为应对放射科医师短缺、提升诊疗效率提供了切实可行的方案，更展示了“医疗系统即数据引擎”理念在驱动下一代医学AI中的巨大潜力。

正如研究者所言：“Prima exemplifies the transformative potential of integrating health systems and medical foundation models to improve healthcare.”未来，该框架有望拓展至CT、超声等模态，并整合基因组学数据，为精准医疗开辟全新路径。

参考文献

Lyu, Y., Harake, S., Chowdury, A. et al. Learning neuroimaging models from health system-scale data. Nat. Biomed. Eng (2026). https://doi.org/10.1038/s41551-025-01608-0

资讯来源

https://medicalxpress.com/news/2026-02-ai-brain-mris-seconds-accuracy.html

编译：万家利

审核：富柄淇

Nature子刊：新发现！AI模型能够在几秒钟内读取大脑核磁共振成像，准确率高达97.5%

产品中心

官网动态

研究动态

关于我们

服务热线

客服邮箱