PRL: التعلّم بالعكس

أحد لونين يمنح +10. وعند انعكاس القاعدة — بدّل

عن التمرين

PRL هي مهمّة تعلُّم انعكاسي احتمالي. تواجه خيارين وتنتقي أحدهما في كل محاولة؛ الخيار الأفضل يثيب في معظم الأوقات لا دائماً، فتتعلّم بالتجربة والخطأ أيّهما 'الجيّد' حالياً. ثم تنقلب القاعدة دون سابق إنذار فيصير الخيار الآخر هو الأفضل، ومهمّتك أن تلاحظ التغيّر وتبدّل اختيارك بدلاً من التمسّك بعناد بما كان ينجح سابقاً.

ماذا يطوّر

تدرّب على المرونة المعرفية والتعلّم المدفوع بالتغذية الراجعة في ظلّ عدم اليقين: التمسّك بقاعدة ما دامت تثيب، والتمييز بين انعكاس حقيقي وسلسلة من سوء الحظّ، وتحديث اختيارك دون مبالغة في ردّ الفعل تجاه نتيجة مضلِّلة واحدة.

التاريخ

نمت الفكرة من أبحاث تعلُّم الحيوان في منتصف القرن العشرين، حيث كان الحيوان يُدرَّب على تمييز بسيط ثم تُعكَس عليه شروط المكافأة لمعرفة مدى سرعة إعادة تعلّمه. أمّا النسخة الاحتمالية الخاصة بالبشر فتبلورت في علم الأعصاب المعرفي مطلع العقد الأول من الألفية، حين أُضيفت تغذية راجعة مشوَّشة لمحاكاة عدم اليقين الواقعي على نحوٍ أفضل ولسبر كيفية تعامل الدماغ مع القواعد المتغيّرة.

من ابتكره ومتى

لا يوجد مبتكر واحد. التعلّم الانعكاسي يأتي من تقليد السلوكيين في دراسات التمييز والانعكاس في أربعينيات وخمسينيات القرن العشرين، ويُقرَن بباحثين مثل Harry Harlow وآل Kendler وN. J. Mackintosh. أمّا مهمّة الانعكاس الاحتمالي الحديثة المستخدَمة في التصوير الدماغي البشري فتُنسَب عادةً إلى Roshan Cools وLuke Clark وزملائهم في كامبريدج نحو عام 2002، بناءً على ذلك الإرث الأقدم لا تأسيساً له.

كيفية التدريب

تعامَل مع نتيجة سيّئة واحدة بوصفها تشويشاً لا دليلاً: لا تستنتج أنّ القاعدة قد انقلبت إلا بعد عدّة إخفاقات متتالية من الخيار الذي ظننتَه الأفضل. احتفِظ بحصيلة ذهنية تقريبية للنتائج الأخيرة بدلاً من ردّ الفعل على آخر محاولة، وبمجرّد أن تبدّل اختيارك، التزم بالخيار الجديد فترةً كافية لتأكيده قبل أن تعاود الشكّ فيه.

مدة التدريب

الجلسات القصيرة المنتظمة هي الأفضل: نحو 5 إلى 10 دقائق، بضع مرات أسبوعياً. المهارة التي تُمارَس هنا هي التحديث السريع، لذا تتفوّق عدّة فترات قصيرة على انكباب طويل واحد يجعلك الإرهاق فيه إمّا شديد التوتّر أو شديد الجمود.

الأساس العلمي

الأدلّة أقوى ما تكون للأمر البديهي: مع التمرّن تتحسّن في المهمّة نفسها وفي التمييز بين التغيّرات الحقيقية في القاعدة وبين السلاسل غير المحظوظة، والمهمّة تتتبّع بصورة موثوقة الفوارق في المرونة بين المجموعات في الأبحاث السريرية والعصبية. أمّا الادعاءات بأنّ هذا النوع من التدريب ينتقل على نطاق واسع إلى اتخاذ القرارات اليومية أو إلى 'المرونة المعرفية' العامّة فهي ضعيفة ومحلّ خلاف، والأدبيات الأوسع لتدريب الدماغ لا تعطي سبباً يُذكَر لتوقّع انتقال بعيد، فعامِل أيّ وعد كبير بحذر.

توصيات

قبل أن تبدّل، اسأل نفسك إن كنت قد رأيت فعلاً نمطاً من الإخفاقات أم مجرّد نتيجة واحدة غير محظوظة، ولا تنقلب إلا حين تتراكم الأدلّة.

الأسئلة الشائعة

لماذا خسرت رغم أنني اخترت الخيار 'الصحيح'؟

لأنّ الخيار الجيّد يثيب في معظم الأوقات لا في كلّها. الخسارة الواحدة غالباً مجرّد تشويش؛ ولم تنقلب القاعدة بالضرورة.

كيف أعرف أنّ القاعدة قد انقلبت فعلاً؟

ابحث عن سلسلة من النتائج الرديئة من الخيار الذي كان ينجح، لا عن نتيجة سيّئة واحدة. حين تتجمّع الإخفاقات معاً، فتلك إشارتك إلى التبديل.

هل ستجعلني هذه اللعبة أكثر مرونة في الحياة الواقعية؟

ستجعلك بصورة موثوقة أفضل في هذه المهمّة وأمثالها. أمّا الانتقال الواسع إلى القرارات اليومية فغير مدعوم جيّداً، فاستمتع بالتمرّن دون أن تراهن على مكاسب تغيّر حياتك.

الأنواع

تُغيّر التنويعات الصعوبة بضبط مدى موثوقية الخيار الجيّد (مثلاً 80/20 مقابل 70/30 الأكثر تشويشاً)، وعدد مرّات حدوث الانعكاسات، وما إذا كنت تتتبّع خيارين أو عدّة خيارات، وما إذا كانت التغذية الراجعة تأتي مكافآتٍ أو خسائرَ أو كليهما. أمّا النسخ الحتمية فتزيل الحظّ كلياً وتكتفي بقلب قاعدة تصحّ دائماً.

العب في المتصفح تنزيل