数据导入
西门子、飞利浦、联影、GE…发布:2023-09-02 浏览:113 次
点击【下方卡片】关注我们~最新前沿资讯抢先看
开放转载,欢迎大家转发到朋友圈和微信群
可添加小编微信【13295818579】获取原文
了解大脑活动并恢复编码信息是认知神经科学的关键目标,但由于脑信号的复杂潜在表征以及相关数据(fMRI-image) 标注的稀缺,以往的研究都主要聚焦在重建静态图像,而以高清视频形式来重构并展现大脑活动的工作还是较为有限。
2023年3月29日,新加坡国立大学的陈子娇(在读博士)、香港中文大学的卿佳鑫(在读博士)和新加坡国立大学的周涓副教授及其研究团队的题为“Seeing Beyond the Brain: Conditional Diffusion Model with Sparse Masked Modeling for Vision Decoding”已被CVPR 2023接收。研究通过MinD-Video的方法,弥合图像和视频大脑解码之间差距,从而以高清视频的形式将人类脑中的信息展示出来。
研究人员先利用大规模自监督学习与稀疏编码掩码大脑建模(Sparse-Coded Masked Brain Modeling,SC-MBM)来学习一般的视觉fMRI特征,再使用具有双条件的潜在扩散模型(latent diffusion model with double conditioning, DC-LDM))从学习到的fMRI表征中生成可信的可见图像。
MinD-Vis. Stage A and Stage B
在第二个模块中,团队通过与增强版Stable Diffusion模型的共同训练来微调学习到的特征,这个模型是专门为fMRI技术下的视频生成而量身定制的。如此方法之下,团队也与此前的诸多研究做了对比,可以明显地看到MinD-Video方法所生成的图片、视频质量要远优于其它方法。
BOLD5000数据集
参考链接
[1]https://mind-video.com/
[2]https://twitter.com/ZijiaoC/status/1660470518569639937
[3]https://arxiv.org/abs/2211.06956