PRL：逆转学习

两种颜色之一给 +10。规则逆转时——切换

关于这个训练

PRL是一个概率性反转学习任务。你面前有两个选项，每一轮选一个；较好的那个选项大多数时候会给你回报，但并非每次都给，所以你要通过反复试错来学会当前哪一个是『好』的。规则会毫无预警地翻转，另一个选项变成更好的那个，而你的任务就是察觉这一变化并切换，而不是固执地守着那个曾经管用的选项。

锻炼什么

它训练认知灵活性以及不确定情境下由反馈驱动的学习：在一条规则还在给你回报时守住它，把一次真正的反转和一连串的坏运气区分开来，并在更新选择时不会因为单一的误导性结果而反应过度。

历史

这个想法源于20世纪中叶的动物学习研究——先教会动物一个简单的辨别，然后把奖励的关联反转过来，看它们能多快重新学会。供人类使用的概率版本在2000年代初的认知神经科学中成形，当时研究者加入了带噪声的反馈，以更好地模拟现实世界的不确定性，并探查大脑如何应对不断变化的规则。

由谁、何时创建

它没有单一的发明者。反转学习源自20世纪40、50年代辨别反转研究的行为主义传统，与Harry Harlow、Kendler夫妇以及N. J. Mackintosh等研究者相关联。用于人类脑成像的现代概率反转任务通常归功于剑桥的Roshan Cools、Luke Clark及其同事在2002年前后的工作，他们是在那条更古老的脉络上加以发展，而非开创它。

如何训练

把单次的坏结果当成噪声，而不是证据：只有当你原本认为最佳的那个选项连续好几次失手之后，才能断定规则已经翻转。在心里对近期结果保持一个大致的计数，而不是对最后一次结果做出反应；一旦你切换了，就在新的选择上坚持足够久以确认它，然后再去怀疑。

练习多久

短而规律的练习效果最好：大约5到10分钟，每周几次。这里锻炼的技能是快速更新，所以几个短回合胜过一次漫长的硬刷——疲劳会让你要么过于神经质，要么过于僵化。

研究依据

证据最强的是那个显而易见的部分：随着练习，你会越来越擅长这个任务本身，也越来越能把真正的规则变化和倒霉的连败区分开来，而且该任务在临床与神经科学研究中可靠地反映了不同人群在灵活性上的差异。至于这类训练能广泛迁移到日常决策或一般『认知灵活性』的说法则很薄弱且有争议，更宽泛的健脑训练文献也几乎没有理由让人期待远迁移，所以对任何宏大的承诺都要保持谨慎。

建议

在切换之前，先问问自己：你究竟看到的是一连串失败的模式，还是仅仅一次倒霉的结果？只有当证据累积起来时才翻转。

常见问题

为什么我选了『正确』的选项却还是输了？

因为好选项只是大多数时候给回报，而不是每次都给。单次的输往往只是噪声；规则未必已经反转。

我怎么知道规则到底什么时候翻转了？

去找那个曾经管用的选择连续出现的几次糟糕结果，而不是单一的坏结果。一旦失手扎堆出现，那就是你该切换的信号。

这会让我在现实生活中更灵活吗？

它一定会让你在这个任务以及类似任务上做得更好。能否广泛迁移到日常决策并没有得到充分支持，所以尽管享受这份练习，但别指望它能改变人生。

变体

各种变体通过调整好选项的可靠程度来改变难度（例如80/20对比噪声更大的70/30）、反转发生的频率、你追踪的是两个还是多个选项，以及反馈是以奖励、以损失还是两者兼有的形式呈现。确定性版本则完全去掉运气成分，单纯翻转一条始终成立的规则。

在浏览器体验下载