强迫症(obsessive-compulsive disorder)和病理性赌博(pathological gambling )伴随着行为灵活性的缺陷。在强化学习中,这种不灵活性可以从高于和低于期望的结果中反映不对称学习的情况(asymmetric learning)。强化学习是由奖赏预测误差驱动的(误差指实际报酬与期望报酬之间的差异),这与包括中脑、纹状体、内侧前额叶皮层和前脑岛在内的脑区活动有关。 2023年3月14日,澳大利亚墨尔本大学的Shinsuke Suzuki在PLOS Biology(IF=9.593)上发表题为“Individuals with problem gambling and obsessive-compulsive disorder learn through distinct reinforcement mechanisms”的研究中报告了患有强迫症和赌博成瘾被试之间寻求奖励行为的不同模式。本研究发现:当奖励低于预期时,强迫症患者的学习率低于正常水平。而那些赌博成瘾的被试在奖励高于和低于预期时表现出增强和迟钝的学习模式。 研究认为,了解强迫行为和成瘾行为之间的差异有助于研讨治疗赌博成瘾和强迫症等疾病的方法。尽管强迫症和赌博成瘾等行为具有行为不灵活等特征,但它们的独特性可能与大脑中处理基于奖励的学习方式的差异有关。 研究纳入了29名强迫症患者,17名有赌博问题的被试和34名健康被试执行强化学习任务,同时用功能磁共振成像记录他们的大脑活动。实验任务包括2个试次,3种条件(奖赏、回避和中性试次)按照伪随机顺序交叉出现,即在每个试次上随机呈现其中一个条件,被试反复做出选择,在奖赏试次中获得奖赏,在回避试次中避免损失。在每个试次中,被试从两个刺激中选择一个,然后根据被选中选项的概率接受奖励、损失或没有。 图注:实验任务和基本行为 研究人员发现:在行为上,在寻求奖励时,当奖励低于预期时,强迫症患者的学习效果不如对照组,其背侧前额叶皮层和背纹状体中的编码低于正常的负面预测误差。除了这种“学习不足”,有赌博问题的被试在奖励高于预期时也表现出“过度学习”。对于这些个体,前岛叶的活动反映出高于正常的正面预测误差。与寻求奖励行为的这些差异相反,当被要求避免不良结果时,两组与对照组并无显著性差异。 图注:奖赏预测误差的相关脑区 研究认为,患有赌博问题和强迫症的被试表现出比预期更好和更差的独特的学习模式。此外,该研究强调了使用神经计算方法来研究精神疾病的好处。通过梳理正/负强化学习的差异,这种方法可以帮助辨别不同条件之间的细微差异,这可能指向不同的治疗方法。 参考文献:Suzuki, S., Zhang, X., Dezfouli, A., Braganza, L., Fulcher, B. D., Parkes, L., Fontenelle, L. F., Harrison, B. J., Murawski, C., Yücel, M., & Suo, C. (2023). Individuals with problem gambling and obsessive-compulsive disorder learn through distinct reinforcement mechanisms. PLoS biology, 21(3), e3002031. https://doi.org/10.1371/journal.pbio.3002031 资讯来源:https://neurosciencenews.com/ocd-gambling-learning-22791/ 编译:展琳琳 校审:李 杰