电子科技大学徐鹏、李发礼团队：个体决策中的反馈加工及其脑机制

2026-06-04 17:16:00 发布者: 查看:

电子科技大学徐鹏、李发礼老师团队使用ANT Neuro公司生产的eego mylab 64通道脑电系统，研究了个体在赌博任务中“收益最大化”目标下的反馈加工及其脑机制，发现当结果偏离最优收益目标时，即使表面获益，大脑仍会产生更强的预测误差信号并引发额叶—扣带系统的神经活动增强。

1.研究背景

在日常生活中，人们几乎无时无刻不在做决策，而这些决策往往依赖于对过往结果的不断反思与调整。赌博任务正是研究这一过程的经典范式，它能够清晰地呈现“选择—反馈—再选择”的动态循环。本研究聚焦于这样一个更贴近现实的问题：当我们得到的结果并未真正实现“收益最大化”这一目标时，大脑究竟如何识别这种偏差，并据此修正接下来的行为？以往研究通常将反馈简单划分为“获益”或“损失”，并考察大脑对正负结果的不同反应，例如内侧额叶负波(medial frontal negativity, MFN)对损失更为敏感。然而，这种划分在现实情境中显得过于简化，因为人们对结果的评价往往是相对的，而非绝对的。举例来说，在赌博任务中，获得5元虽然是“赢钱”，但如果本可以通过另一选择获得25元，这一结果依然可能被个体视为一种“没有选对”的决策。换言之，人们不仅关注“有没有赚到”，更在意“是否赚到了最多”。

基于这一视角，本研究将反馈进一步拆分为金钱结果和行为正确性两个维度，试图揭示当结果与目标不一致时，大脑如何产生预测误差、进行反馈监测，并推动后续决策的调整。同时，结合事件相关电位(event-related potential, ERP)、皮层源定位以及功能连接网络分析，从多个层面系统地探索这一过程的神经机制，从而更深入地理解人类如何在不断变化的环境中优化自己的选择。

2.研究方法

研究共纳入30名健康右利手成人被试，平均年龄为22.7岁，所有被试均无精神或神经系统疾病史。在实验任务中，被试完成经典赌博范式：每个试次先呈现注视点，随后同时出现标有“5”与“25”的两个赌注方框，被试需在限定时间内选择其一；在短暂空屏后，系统以红色或绿色反馈提示该选择对应的是损失还是获益，同时未选选项的反馈结果也一并呈现，从而使被试能够进行反事实比较。基于“收益最大化”原则，将反馈划分为四类核心条件，即获益且正确(gain-correct, GC)、获益但错误(gain-error, GE)、损失且正确(loss-correct, LC)以及损失且错误(loss-error, LE)。

图1 赌博任务中出现了四种数字与颜色的潜在组合

脑电数据使用ANT Neuro eego™ mylab 64通道脑电系统采集，电极按照国际10–20系统布置，采样率为500 Hz，电极阻抗控制在5 kΩ以下。数据分析主要提取反馈相关的事件相关电位(ERP)成分，包括P200和内侧额叶负波(MFN)，并结合标准化低分辨率脑电磁层析成像(sLORETA)进行源定位。此外，研究基于相位锁定值(phase-locking value, PLV)构建功能连接网络，以分析不同反馈条件下的脑区间同步模式。最后，通过比较不同反馈后的反应时，评估反馈加工对后续决策行为的影响。

图2 ANT Neuro eego™ mylab

3. 实验结果

ERP结果显示，获益背景下的错误反馈(GE)相较于获益背景下的正确反馈(GC)诱发了显著更大的P200和内侧额叶负波(MFN)振幅。该结果表明，即使个体在当前试次中获得了正性收益，当该结果未能实现收益最大化目标时，大脑仍将其加工为目标不一致的信息，并引发更强的注意分配与反馈监测过程。相比之下，在损失背景下，损失且错误(LE)与损失但正确(LC)条件在P200和MFN振幅上均未呈现显著差异，提示在整体负性结果情境中，反馈效价可能主导加工过程，从而削弱了行为正确性维度的影响。

图3 ERP波形对比

皮层源定位结果进一步表明，相较于GC条件，GE条件引发了更强的额叶、顶叶和颞叶皮层活动，主要涉及中额回、额下回、内侧额回、扣带回及前扣带皮层等区域；而在损失背景下，LC相较于LE主要表现为右侧额叶区域活动增强。

图4 正确与错误反馈在获益与损失背景下的皮层激活差异，不同颜色表示各子图中显著激活的脑区。

在功能连接网络层面，显著差异主要出现在低频振荡范围内。具体而言，在获益背景下，GE相较于GC表现出更强的delta频段中程连接以及theta频段长程额枕连接；在损失背景下，LC相较于LE则表现出更强的delta和theta频段跨额叶、顶叶及枕叶的连接，而alpha、beta和gamma频段均未观察到显著差异。这表明，theta频段连接可能更多反映对不确定性和预测误差的加工过程，而delta频段连接则可能与对反馈信息的深入评估及动机调整有关。

图5 在获益(a)与损失(b)背景下，正确与错误反馈在delta、theta、alpha、beta和gamma频段中的功能连接网络差异。

行为结果显示，在获益背景中，被试在经历GE反馈后进行下一次高风险选择时的反应时显著短于GC条件，表明目标不一致的获益反馈可能促使个体更快地调整后续决策策略；而在损失背景中，LC与LE条件之间的高风险选择反应时差异不显著。

图6 不同反馈条件后赌博任务中风险选择的反应时

4. 结论

研究表明，赌博任务中的反馈加工不仅受结果效价(获益或损失)的影响，还显著依赖于反馈结果与任务目标(收益最大化)之间的一致性。当反馈结果偏离最优收益目标时，即使其在表面上表现为正性结果，个体仍会产生更显著的预测误差信号，表现为更大的内侧额叶负波(MFN)振幅以及额叶—扣带系统相关脑区神经活动的增强。同时，在功能连接层面，这种目标不一致的反馈主要调节低频振荡活动，表现为theta频段长程连接和delta频段中程连接的增强，分别反映对不确定性及预测误差的加工，以及对反馈信息的深入评估与动机调节过程。此外，行为结果表明，与目标不一致的获益反馈能够促进个体在后续决策中更快速地进行风险选择，提示预测误差不仅体现在神经加工层面，还会进一步影响行为调整。

总体而言，本研究从事件相关电位、皮层源活动及功能连接网络多个层面提供了收敛证据，表明反馈监测过程本质上是围绕目标实现程度展开的动态评估机制，而非对结果效价的简单响应。该发现深化了对反馈加工与决策调节神经机制的理解，并为基于脑电信号预测个体后续决策行为提供了重要的神经电生理学依据。

5. 论文信息

Jiang, L., Wang, G., Zhang, S., Ye, J., He, R., Chen, B., ... & Li, F. (2024). Feedback-related brain activity in individual decision: evidence from a gambling EEG study. Cerebral Cortex, 34(1), bhad430.https://doi.org/10.1093/cercor/bhad430

电子科技大学徐鹏、李发礼团队：个体决策中的反馈加工及其脑机制

1.研究背景

2.研究方法

3. 实验结果

4. 结论

5. 论文信息

产品中心

技术方案

技术支持

新闻资讯

关于我们

联系我们