PRL: Aprendizagem Reversa
Uma de 2 cores paga +10. Quando a regra inverte — mude
Sobre o exercício
PRL é uma tarefa de aprendizagem por reversão probabilística. Você se depara com duas opções e escolhe uma a cada tentativa; a melhor opção compensa na maioria das vezes, mas não sempre, então você aprende por tentativa e erro qual delas é a 'boa' no momento. Sem aviso, a regra se inverte e a outra opção passa a ser a melhor, e sua missão é perceber a mudança e trocar, em vez de insistir teimosamente no que costumava funcionar.
O que desenvolve
Treina a flexibilidade cognitiva e a aprendizagem orientada por feedback sob incerteza: manter uma regra enquanto ela compensa, distinguir uma reversão genuína de uma sequência de azar e atualizar sua escolha sem reagir em excesso a um único resultado enganoso.
História
A ideia nasceu da pesquisa sobre aprendizagem animal de meados do século XX, em que animais eram ensinados a fazer uma discriminação simples e depois tinham as contingências de recompensa invertidas, para ver quão rápido conseguiam reaprender. A versão probabilística para humanos tomou forma na neurociência cognitiva por volta do início dos anos 2000, quando se acrescentou feedback ruidoso para imitar melhor a incerteza do mundo real e investigar como o cérebro lida com regras em mudança.
Quem criou e quando
Não há um único inventor. A aprendizagem por reversão vem da tradição behaviorista dos estudos de reversão de discriminação das décadas de 1940 e 1950, associada a pesquisadores como Harry Harlow, os Kendler e N. J. Mackintosh. A moderna tarefa de reversão probabilística usada em neuroimagem humana costuma ser creditada a Roshan Cools, Luke Clark e colegas em Cambridge por volta de 2002, que se apoiaram nessa linhagem mais antiga em vez de fundá-la.
Como treinar
Trate um resultado ruim como ruído, não como prova: só conclua que a regra se inverteu depois de vários erros seguidos da opção que você julgava ser a melhor. Mantenha uma contagem mental aproximada dos resultados recentes em vez de reagir à última tentativa, e, uma vez que tenha trocado, comprometa-se com a nova escolha por tempo suficiente para confirmá-la antes de voltar a duvidar.
Quanto praticar
Sessões curtas e regulares funcionam melhor: cerca de 5 a 10 minutos, algumas vezes por semana. A habilidade exercitada é a atualização rápida, então vários blocos curtos batem uma maratona longa, em que o cansaço deixa você nervoso demais ou rígido demais.
Base de evidências
A evidência é mais forte para o óbvio: com a prática você melhora na própria tarefa e em distinguir mudanças reais de regra de sequências de azar, e a tarefa acompanha de forma confiável diferenças de flexibilidade entre grupos na pesquisa clínica e em neurociência. Afirmações de que esse tipo de treino se transfere amplamente para a tomada de decisão cotidiana ou para a 'flexibilidade cognitiva' geral são fracas e contestadas, e a literatura mais ampla sobre treino cerebral dá poucos motivos para esperar transferência distante, então trate qualquer promessa grandiosa com cautela.
Recomendações
Antes de trocar, pergunte-se se realmente viu um padrão de falhas ou apenas um resultado de azar, e só inverta quando as evidências tiverem se acumulado.
Perguntas frequentes
Por que perdi mesmo escolhendo a opção 'certa'?
Porque a opção boa só compensa na maioria das vezes, não em todas. Uma única perda costuma ser apenas ruído; a regra não necessariamente se inverteu.
Como sei quando a regra de fato mudou?
Procure por uma sequência de resultados ruins da escolha que costumava funcionar, não por um único resultado ruim. Quando os erros se agrupam, esse é o seu sinal para trocar.
Isto vai me tornar mais flexível na vida real?
Vai confiavelmente deixá-lo melhor nesta tarefa e em outras parecidas. A transferência ampla para decisões cotidianas não tem bom respaldo, então aproveite a prática sem apostar em ganhos que mudam a vida.
Variações
As variações mudam a dificuldade ajustando o quão confiável é a opção boa (por exemplo 80/20 contra um mais ruidoso 70/30), com que frequência ocorrem as reversões, se você acompanha duas opções ou várias, e se o feedback vem como recompensas, como perdas ou ambos. Versões determinísticas removem a sorte por completo e simplesmente invertem uma regra que sempre vale.