अत्यधिक दक्षता के दुष्प्रभाव (2022)
(sohl-dickstein.github.io)बहुत अधिक दक्षता सब कुछ खराब कर देती है: overfitting और Goodhart के नियम का मजबूत संस्करण
दक्षता बढ़ने पर विडंबनापूर्ण रूप से परिणाम खराब हो सकते हैं। यह बात लगभग हर जगह सही बैठती है। इस घटना को हम Goodhart के नियम का मजबूत संस्करण कहेंगे। उदाहरण के लिए, standardized tests के जरिए छात्रों की उपलब्धि को केंद्रीय रूप से ट्रैक करना एक अच्छा विचार लग सकता है, लेकिन इससे स्कूल सिर्फ परीक्षा की तैयारी पर ध्यान केंद्रित करने लगते हैं और समग्र शिक्षा-परिणाम खराब हो सकते हैं। राजनीति, अर्थव्यवस्था, स्वास्थ्य, विज्ञान जैसे कई क्षेत्रों में भी ऐसे ही उदाहरण मिलते हैं।
overfitting और Goodhart का नियम
- overfitting: मशीन लर्निंग में अक्सर लक्ष्य को सीधे साधा नहीं जा सकता, इसलिए मॉडल को train करने के लिए उससे मिलते-जुलते proxy का उपयोग किया जाता है। शुरुआत में proxy बेहतर होता है तो लक्ष्य भी बेहतर होता है, लेकिन optimization जारी रखने पर ऐसा बिंदु आता है जहाँ proxy तो बेहतर होता जाता है, पर लक्ष्य अब और नहीं सुधरता। इसे overfitting कहा जाता है।
- Goodhart का नियम: जब कोई measure ही लक्ष्य बन जाता है, तो वह अच्छा measure नहीं रह जाता। यह सिर्फ अर्थशास्त्र ही नहीं, बल्कि कई और क्षेत्रों पर भी लागू होता है।
Goodhart के नियम का मजबूत संस्करण: जब हम बहुत अधिक efficient हो जाते हैं, तो वही चीज खराब होने लगती है जिसकी हमें परवाह है
- अगर proxy goal को लगातार optimize किया जाए, तो असली goal खराब हो सकता है। मशीन लर्निंग में यह बहुत आम घटना है।
- Goodhart के नियम का मजबूत संस्करण: जब कोई measure लक्ष्य बन जाता है और उसे प्रभावी ढंग से optimize किया जाता है, तो वही चीज खराब होने लगती है जिसे वह measure करने की कोशिश करता है।
बढ़ती दक्षता और overfitting हर जगह मौजूद हैं
- दक्षता बढ़ने से पूरे समाज में सकारात्मक या नकारात्मक दोनों तरह के परिणाम हो सकते हैं।
- उदाहरण:
- लक्ष्य: बच्चों को अच्छी शिक्षा देना
- proxy: standardized test scores
- परिणाम: केवल परीक्षा-तैयारी पर ध्यान, जिससे वास्तविक शिक्षा की गुणवत्ता गिरती है
- लक्ष्य: विज्ञान की तेज प्रगति
- proxy: publications की संख्या पर आधारित bonus
- परिणाम: गलत या अविश्वसनीय शोध-परिणामों के प्रकाशन में वृद्धि
- लक्ष्य: स्वस्थ आबादी
- proxy: पोषक भोजन तक पहुँच
- परिणाम: मोटापे की समस्या
- लक्ष्य: बच्चों को अच्छी शिक्षा देना
overfitting और Goodhart के नियम के मजबूत संस्करण को कम करने के तरीके
- proxy goal और इच्छित परिणाम के बीच बेहतर मेल: मशीन लर्निंग में test स्थिति से मिलते-जुलते training examples इकट्ठा किए जाते हैं। सामाजिक प्रणालियों में कानून, incentives और social norms को बदलकर उन्हें लक्ष्य के अधिक अनुरूप बनाया जाता है।
- regularization penalty जोड़ना: मशीन लर्निंग में parameters का आकार छोटा रखा जाता है। सामाजिक प्रणालियों में complexity कम की जाती है या अतिरिक्त लागत लगाई जाती है।
- system में noise inject करना: मशीन लर्निंग में input, parameters और internal state में random noise जोड़ा जाता है। सामाजिक प्रणालियों में भी random elements जोड़कर predictability कम की जाती है।
- early stopping: मशीन लर्निंग में validation loss बिगड़ना शुरू हो जाए तो training रोक दी जाती है। सामाजिक प्रणालियों में decision-making time सीमित किया जाता है या market activity रोकी जाती है।
- क्षमता/सामर्थ्य सीमित करना: मशीन लर्निंग में मॉडल को छोटा रखा जाता है ताकि overfitting से बचा जा सके। सामाजिक प्रणालियों में संगठनों या agents की capacity सीमित की जाती है।
- क्षमता/सामर्थ्य बढ़ाना: मशीन लर्निंग में कभी-कभी मॉडल को बहुत बड़ा बनाया जाता है ताकि overfitting से बचा जा सके। सामाजिक प्रणालियों में क्षमता को बहुत बढ़ाकर goal और proxy के बीच trade-off को हटाने की कोशिश की जाती है।
समापन विचार
Goodhart के नियम का मजबूत संस्करण AI को लेकर मेरी व्यक्तिगत आशंकाओं की मूल वजह है। AI लगभग हर काम में दक्षता बढ़ा सकता है। इस समस्या को हल करने के लिए शोध के बहुत अवसर हैं। अगर सामाजिक प्रणालियाँ Goodhart के नियम के मजबूत संस्करण की वजह से ढहने लगें, तो इसे ठीक करने के लिए तर्कसंगत कदम उठाना मुश्किल हो जाता है। इस घटना को नाम देना और इसे बेहतर समझना मददगार होगा।
GN⁺ की संक्षिप्त प्रस्तुति
- Goodhart के नियम का मजबूत संस्करण बताता है कि दक्षता बढ़ने पर लक्ष्य खराब हो सकता है।
- यह मशीन लर्निंग में overfitting जैसी घटना है और कई क्षेत्रों में लागू हो सकती है।
- proxy goal और वास्तविक goal के बीच बेहतर मेल, regularization penalty, और system में noise inject करने जैसे तरीकों से इस समस्या को कम किया जा सकता है।
- AI से बढ़ती दक्षता के कारण कई तरह के दुष्प्रभाव पैदा हो सकते हैं, और उन्हें सुलझाने के लिए शोध की जरूरत है।
- सामाजिक प्रणालियाँ ढहें नहीं, इसके लिए Goodhart के नियम के मजबूत संस्करण को समझना और उसके अनुसार प्रतिक्रिया देना महत्वपूर्ण है।
2 टिप्पणियां
मैंने सुना है कि हमारे देश की CSAT परीक्षा गणितीय क्षमता मापने के अपने शुरुआती उद्देश्य से हटकर, सिर्फ़ grade cutoffs के वितरण को अधिक कुशल बनाने वाली एक system में बदल गई है। यह Goodhart's law से आगे न बढ़ पाने का एक उदाहरण लगता है।
Hacker News की राय
Jascha, Google Brain में काम कर चुके एक बेहतरीन ML researcher हैं और फिलहाल Anthropic में हैं
dynamical isometryजैसे concepts के जरिए बहुत गहरे transformer models का convergence हासिल कियाGoodhart's law कहता है कि जब कोई measure खुद लक्ष्य बन जाता है, तो वह अच्छा measure नहीं रह जाता
Sweden में पिछले 20 वर्षों से यह एक सामाजिक समस्या के रूप में उभरा है
exercise physiology में भी ऐसा ही एक law मौजूद है
queueing theory में भी इससे जुड़ा एक law है
GDP पर ध्यान केंद्रित करना पसंद नहीं है
स्थानीय hardware store में इस law का एक उदाहरण मिला
chain restaurants में जाने पर भी ऐसा ही अनुभव हुआ
लेखक का नाम याद आ गया
प्रभाव तो मौजूद है, लेकिन उदाहरण सटीक नहीं हैं