PRL: प्रतिवर्ती अधिगम

2 रंगों में से एक +10 देता है। नियम पलटने पर — बदलें

इस ट्रेनर के बारे में

PRL एक प्रायिकता-आधारित उलट-सीखने (प्रोबैबिलिस्टिक रिवर्सल-लर्निंग) वाला कार्य है। आपके सामने दो विकल्प होते हैं और हर बारी पर आप एक चुनते हैं; बेहतर विकल्प ज़्यादातर बार इनाम देता है पर हमेशा नहीं, इसलिए आप आज़माइश-और-गलती से सीखते हैं कि फ़िलहाल कौन-सा 'अच्छा' है। बिना किसी चेतावनी के नियम पलट जाता है और दूसरा विकल्प बेहतर हो जाता है, और आपका काम है इस बदलाव को भाँपकर पाला बदलना — न कि ज़िद में उसी से चिपके रहना जो पहले काम कर रहा था।

क्या विकसित करता है

यह संज्ञानात्मक लचीलापन और अनिश्चितता के बीच फ़ीडबैक से चलने वाली सीख का अभ्यास कराता है: जब तक कोई नियम फ़ायदा दे रहा हो तब तक उसे थामे रखना, असली उलटफेर को बुरे भाग्य की लड़ी से अलग पहचानना, और किसी एक भ्रामक नतीजे पर हद से ज़्यादा प्रतिक्रिया किए बिना अपना चुनाव अपडेट करना।

इतिहास

यह विचार बीसवीं सदी के मध्य के पशु-सीख संबंधी शोध से पनपा, जहाँ जानवरों को एक सरल भेद सिखाया जाता और फिर इनाम की शर्तें उलट दी जातीं ताकि देखा जा सके कि वे कितनी जल्दी दोबारा सीख पाते हैं। इंसानों के लिए इसका प्रायिकता-आधारित रूप 2000 के दशक की शुरुआत के आसपास संज्ञानात्मक तंत्रिका-विज्ञान में आकार लेने लगा, जब असल दुनिया की अनिश्चितता की बेहतर नकल करने और यह जाँचने के लिए कि दिमाग बदलते नियमों से कैसे निपटता है, फ़ीडबैक में शोर (नॉइज़) जोड़ा गया।

किसने और कब बनाया

इसका कोई एकमात्र आविष्कारक नहीं है। उलट-सीखना 1940 और 1950 के दशक के भेद-उलटफेर (डिस्क्रिमिनेशन-रिवर्सल) अध्ययनों की व्यवहारवादी परंपरा से आता है, जो Harry Harlow, Kendler दंपती और N. J. Mackintosh जैसे शोधकर्ताओं से जुड़ा है। इंसानी इमेजिंग में इस्तेमाल होने वाला आधुनिक प्रायिकता-आधारित उलट-कार्य आमतौर पर Roshan Cools, Luke Clark और कैंब्रिज के उनके साथियों को (लगभग 2002 में) श्रेय दिया जाता है, जिन्होंने इस पुरानी परंपरा पर आगे बढ़ते हुए इसे गढ़ा, न कि इसकी नींव रखी।

कैसे अभ्यास करें

एक बुरे नतीजे को शोर मानिए, सबूत नहीं: यह नतीजा तभी निकालिए कि नियम पलट गया है जब उसी विकल्प से, जिसे आप सबसे अच्छा समझते थे, लगातार कई बार चूक हो जाए। बिल्कुल आख़िरी बारी पर प्रतिक्रिया करने के बजाय हाल के नतीजों का एक मोटा मानसिक हिसाब रखिए, और एक बार पाला बदल लेने के बाद नए चुनाव पर इतनी देर टिके रहिए कि उसे पुष्ट कर सकें, उससे पहले दोबारा शक मत कीजिए।

कितनी देर अभ्यास

छोटे, नियमित सत्र सबसे बेहतर काम करते हैं: करीब 5 से 10 मिनट, हफ़्ते में कुछ बार। जिस कौशल का अभ्यास हो रहा है वह तेज़ अपडेट करना है, इसलिए एक लंबी पिसाई के बजाय कई छोटे खंड बेहतर रहते हैं, जहाँ थकान आपको या तो हद से ज़्यादा हड़बड़ा या हद से ज़्यादा अकड़ू बना देती है।

प्रमाण आधार

सबसे पुख़्ता सबूत उसी स्पष्ट बात का है: अभ्यास के साथ आप इस कार्य में और असली नियम-बदलावों को बदकिस्मती की लड़ी से अलग पहचानने में बेहतर हो जाते हैं, और यह कार्य चिकित्सकीय व तंत्रिका-विज्ञान शोध में समूहों के बीच लचीलेपन के फ़र्क को भरोसेमंद ढंग से नापता है। यह दावा कि इस तरह का प्रशिक्षण रोज़मर्रा के निर्णय-लेने या आम 'संज्ञानात्मक लचीलेपन' तक व्यापक रूप से हस्तांतरित होता है — कमज़ोर और विवादित है, और दिमागी कसरत के व्यापक साहित्य से दूर-हस्तांतरण की उम्मीद करने का कोई खास आधार नहीं मिलता, इसलिए किसी भी बड़े वादे को सावधानी से लीजिए।

सुझाव

पाला बदलने से पहले खुद से पूछिए कि क्या आपने सचमुच विफलताओं का एक पैटर्न देखा है या बस एक बदकिस्मत नतीजा, और तभी पलटिए जब सबूत ढेर हो चुके हों।

सामान्य प्रश्न

मैंने 'सही' विकल्प चुना फिर भी हार क्यों गया?

क्योंकि अच्छा विकल्प सिर्फ़ ज़्यादातर बार इनाम देता है, हर बार नहीं। एक अकेली हार अक्सर बस शोर होती है; ज़रूरी नहीं कि नियम पलट गया हो।

मुझे कैसे पता चले कि नियम सचमुच पलट गया है?

जो विकल्प पहले काम कर रहा था उससे एक बुरे नतीजे को नहीं, बल्कि बुरे नतीजों की एक लड़ी को देखिए। जब चूकें एक साथ गुच्छे में आने लगें, वही आपके पाला बदलने का संकेत है।

क्या यह मुझे असल ज़िंदगी में ज़्यादा लचीला बना देगा?

यह आपको इस कार्य और इससे मिलते-जुलते कार्यों में भरोसेमंद ढंग से बेहतर बना देगा। रोज़मर्रा के फ़ैसलों तक व्यापक हस्तांतरण को अच्छा समर्थन हासिल नहीं है, इसलिए अभ्यास का आनंद लीजिए पर ज़िंदगी बदल देने वाले फ़ायदों पर मत टेकिए।

प्रकार

बदलाव कठिनाई को इस तरह घटाते-बढ़ाते हैं: अच्छा विकल्प कितना भरोसेमंद है इसे समायोजित करके (मसलन 80/20 बनाम ज़्यादा शोर वाला 70/30), उलटफेर कितनी बार होते हैं, आप दो विकल्पों पर नज़र रखते हैं या कई पर, और फ़ीडबैक इनाम के रूप में आता है, नुकसान के रूप में, या दोनों के रूप में। नियतात्मक (डिटरमिनिस्टिक) रूप किस्मत को पूरी तरह हटा देते हैं और बस एक ऐसा नियम पलटते हैं जो हमेशा सच रहता है।

ब्राउज़र में खेलें डाउनलोड