2020年4月23日,华南师范大学心理学院王凌教授实验室在Journal of Experimental Psychology: Learning, Memory, and Cognition上发表了题为“Reinforcement Learning of Irrelevant Stimulus-Response Associations Modulates Cognitive Control”的研究论文。该论文揭示了奖赏通过强化任务无关的刺激-反应联结可以调节认知控制。
认知控制指个体协调认知过程以实现内在目标的能力,尤其是当信息加工中存在干扰或我们身处不熟悉的环境时。研究者常使用冲突范式(例如Stroop、Flanker、和Simon任务)对该过程进行研究。当研究者调整一致试次和不一致试次之间比例的时候,出现了比例一致性效应,表现为冲突效应随着不一致试次占比增大(减小)而减小甚至反转(增大)。过去研究者尝试使用注意调整理论解释该现象背后的机制,但值得注意的是,无论被试如何调整注意,冲突效应可能会减小到0,但不会反转。反转冲突效应的存在表明被试习得了任务无关的刺激-反应联结并用其去预期正确反应。当新习得的刺激-反应联结预期的反应与正确反应存在冲突时,被试反应变慢而且易于出现错误。王凌教授实验室使用fMRI (Xia et al., 2016)和EEG (Cao et al., 2017)技术发现比例一致性效应中的反转冲突(Simon)效应也存在于认知控制系统中。这表明当新习得的无关的刺激-反应联结预期的反应和正确反应不同时,认知控制系统会探测到相应的冲突,从而增强注意控制。这提示我们新习得的无关的刺激-反应联结可以调节认知控制。
本研究通过操纵任务无关的刺激-反应联结与奖赏之间的相倚再次对认知控制的学习观进行验证。实验一采用基于颜色辨别的Simon任务,被试反应又快又准时获得金钱奖赏。通过分别奖赏一致试次、不一致试次、以及随机奖赏的形式,观察到Simon效应的增加(奖赏一致试次)及反转(奖赏不一致试次)(图1)。这表明被试利用奖赏增强的无关的刺激-反应联结去预期正确反应,而当其与实际反应不同时,可能会激活认知控制系统。实验二不但重复了实验一的结果,也进一步发现在奖赏无关颜色中的Simon也存在相似的增加和反转现象(图2)。这说明奖赏增强的无关的刺激-反应联结被泛化到无奖赏情形下去预期正确反应。也就是说出现了无关的刺激-反应联结强化学习效应的迁移,这也排除了其它可能的解释(例如动机)。本研究得到了类似比例一致性效应的实验现象,延续过往王凌教授实验室的研究,揭示了任务无关刺激-反应联结的学习可能是调节认知控制的一般机制。
图1:实验一各条件平均反应时(A)、错误率(B)、反应时Simon效应(C)、错误率Simon效应(D)。RC代表奖赏一致试次,N代表随机奖赏,RI代表奖赏不一致试次。*p < .05, **p < .01, ***p < .001。
图2:实验二后半段各条件平均反应时(A)、错误率(B)、反应时Simon效应(C)、错误率Simon效应(D)。R代表有奖赏颜色,NR代表无奖赏颜色。
王凌教授实验室成员,已毕业本科生陈晶露为论文第一作者,已毕业博士生谭玲和已毕业硕士生刘璐为论文的合作者。王凌教授为论文通讯作者。该研究受到国家自然科学基金(31271085 & 31771250)的资助。
论文链接:
https://psycnet.apa.org/record/2020-28582-001
实验室过往相关研究:
Cao, Y., Cao, X., Yue, Z., & Wang, L. (2017). Temporal and spectral dynamics underlying cognitive control modulated by task-irrelevant stimulus-response learning. Cognitive, Affective & Behavioral Neuroscience, 17(1), 158-173. doi:10.3758/s13415-016-0469-5
Xia, T., Li, H., & Wang, L. (2016). Implicitly strengthened task-irrelevant stimulus-response associations modulate cognitive control: Evidence from an fMRI study. Human Brain Mapping, 37(2), 756-772. doi:10.1002/hbm.23064