नहीं, artificial intelligence सचेत नहीं है – Ted Chiang
(theatlantic.com)- generative AI की धाराप्रवाह वाक्य-निर्माण क्षमता को चेतना या नैतिक कर्तृत्व के साथ भ्रमित करने पर, chatbot के उपयोग से पैदा हुई जिम्मेदारी का ठीकरा गलत जगह फोड़ने जैसी गंभीर गलती होती है
- LLM एक एक बार में एक शब्द की भविष्यवाणी करके बनाने वाली वाक्य-आगे-बढ़ाने की मशीन है, और बातचीत में chatbot और उपयोगकर्ता दोनों ही काल्पनिक पात्रों से अधिक कुछ नहीं हैं
- यह मानना कि LLM के पास चेतना है, Microsoft Word document खुलते ही कई चेतनाएं जाग उठती हैं ऐसा मानने जितनी ही गलत सोच है
- नैतिक तर्क के लिए शरीर-आधारित व्यक्तिपरक अनुभव और भावनाएं पूर्वशर्त हैं, इसलिए बिना शरीर वाले LLM सिर्फ अपने training data में मौजूद नैतिक अभिव्यक्तियों को पुनर्व्यवस्थित करते हैं
- LLM में चेतना न होना उसकी उपयोगिता से असंबंधित है, लेकिन जब AI कंपनियां chatbot को ऐसे पेश करती हैं मानो उसमें नैतिक केंद्र हो, तो वे उपयोगकर्ताओं को जिम्मेदारी से बच निकलने के लिए उकसाती हैं
Anthropic का मानवीकरण और Claude's constitution
- Anthropic ने इस साल की शुरुआत में जारी किए गए 84-पेज के Claude's "constitution" दस्तावेज़ की पहली पंक्ति में साफ लिखा है कि यह "Anthropic द्वारा अभिप्रेत Claude के मूल्यों और व्यवहार का विस्तृत विवरण" है
- दस्तावेज़ में कहा गया है कि यह "Claude को मुख्य पाठक मानकर लिखा गया", "Claude की नैतिक स्थिति गहराई से अनिश्चित है", और "Claude में भावनाओं या अनुभूतियों का कोई कार्यात्मक रूप हो सकता है"
- CEO Dario Amodei ने एक इंटरव्यू में कहा कि वे इस संभावना के लिए "खुले" हैं कि AI में चेतना हो सकती है
- कंपनी की दार्शनिक और इस संविधान दस्तावेज़ की प्रमुख लेखिका मानी जाने वाली Amanda Askell ने कहा कि जब लोग इंटरनेट पर Claude के साथ रूखा व्यवहार करते हैं तो उन्हें चिंता होती है कि कहीं Claude बेचैन न हो जाए, और वे चाहती हैं कि Claude खुश रहे
- generative AI को साधारण तकनीक की तरह समझना भी यह मानने के लिए काफी है कि वह हानिकारक हो सकता है, लेकिन text generation की धाराप्रवाहता को चेतना या नैतिक agency समझ लेना chatbot के उपयोग से पैदा हुई समस्याओं की जिम्मेदारी गलत जगह डाल देता है
LLM कैसे काम करता है — काल्पनिक पात्रों का निर्माण
- अगर आप "Julius Caesar और Genghis Khan के बीच संवाद" जैसा prompt दें, तो LLM एक सुसंगत बातचीत बना सकता है, लेकिन कोई भी इससे यह निष्कर्ष नहीं निकालता कि वे दोनों ऐतिहासिक व्यक्ति सचेत थे
- वे सिर्फ speculative fiction के पात्र हैं
- अगर prompt को बदलकर "एक मददगार AI chatbot और उपयोगकर्ता के बीच बातचीत" कर दिया जाए, तो मूल रूप से कुछ नहीं बदलता; उपयोगकर्ता और chatbot दोनों काल्पनिक पात्र ही रहते हैं
- बीच में मनुष्य सीधे text input करे तब भी वह Caesar या Khan की तरह ही एक काल्पनिक चरित्र से संवाद कर रहा होता है
- computer science के प्रोफेसर Murray Shanahan इसे role-play की तरह देखने का सुझाव देते हैं
- data scientist Colin Fraser इसे "मनुष्य द्वारा LLM के साथ मिलकर दस्तावेज़ लिखना" कहते हैं
- LLM एक समय में सिर्फ एक शब्द बनाता है; अगर उससे Pledge of Allegiance सुनाने को कहा जाए, तो वह दर्जनों बार एक-एक शब्द उत्पन्न करता हुआ अंत में all शब्द तक पहुंचता है
text एक deepfake माध्यम है
- मान लीजिए आप 4.3 प्रकाश-वर्ष दूर Alpha Centauri की परिक्रमा करते एक अंतरिक्ष यात्री का video देखते हैं; image quality कैसी भी हो, आप उसे नकली मानेंगे
- Mars landing, Jupiter और Saturn के चंद्रमाओं तक पहुंच, या Pluto की कक्षा से गुजरने जैसे पूर्व प्रमाण के बिना आप किसी भी video पर भरोसा नहीं करेंगे
- कोई अवलोकन अपने ब्योरे से नहीं बल्कि context से भरोसेमंद साक्ष्य बनता है, और चेतना के बारे में निर्णय भी चेतना के विकास के व्यापक context में ही देखे जाने चाहिए
- चेतना की बहस में text को भी deepfake माध्यम माना जाना चाहिए, क्योंकि दो सचेत प्राणियों की बातचीत की नकल करना वास्तव में एक सचेत program बनाने से कहीं आसान है
- deepfake image बनाने वाले जान-बूझकर दूसरों को धोखा देते हैं, लेकिन LLM बातचीत खींचने वाले बहुत से लोग खुद को ही धोखा दे बैठते हैं
चेतना मानने के लिए विकासात्मक चरण
- किसी सचेत language-using program को मान्यता देने के लिए पहले शरीर (भौतिक या virtual) और इंद्रियां चाहिए
- शरीर के बिना इच्छाएं या भावनाएं नहीं हो सकतीं, और इच्छाएं-भावनाएं चेतना के लिए अनिवार्य मानी जाती हैं
- फिर उसमें छिपकली की तरह जीवित रहने के लिए वातावरण टटोलने की क्षमता, चूहे के स्तर की नई परिस्थितियों से निपटने की क्षमता, भेड़िए के स्तर की जटिल सामाजिक गतिशीलता, और चिंपैंजी के स्तर की औज़ार बनाने की क्षमता क्रमशः होनी चाहिए
- जैसे चिंपैंजी या कुत्तों को सिखाया जाता है, वैसे ही button board जैसी गैर-भाषिक विधियों से इच्छाएं व्यक्त करना भी उसे सीखना होगा, और animal communication शोधकर्ताओं की पूरी जांच-परख भी पार करनी होगी
- यह सब पूरा कर लेने पर भी वह अब भी पूर्ण व्याकरण वाले वाक्यों में विचार व्यक्त करने वाले अस्तित्व से कई प्रकाश-वर्ष दूर होगा
- AlphaFold (Google DeepMind का protein folding prediction program) की संरचना LLM जैसी होते हुए भी कोई यह दावा नहीं करता कि उसमें चेतना है; इससे स्पष्ट होता है कि LLM के सचेत लगने का कारण सिर्फ व्याकरणिक वाक्य output करना है
Claude's constitution का वास्तविक काम
- Claude's constitution को role-play के लिए बना 84-पेज का character sheet मानना सबसे उचित है; इसका काम ग्राहकों के साथ interaction करने वाले मददगार chatbot चरित्र को परिभाषित करना है
- Anthropic इस दस्तावेज़ को training data में बस जोड़ नहीं देता या छिपे stage directions की तरह नहीं डालता, बल्कि fine-tuning के दौरान model के output वाक्य दस्तावेज़ के अनुरूप हैं या नहीं, इसका automated check करके सुसंगतता बढ़ाता है
- नतीजा यह होता है कि मशीन ऐसे वाक्य output करने लगती है जो किसी विचारशील और नैतिक व्यक्ति जैसे लगें, लेकिन first-person pronoun समेत कई श्रेणियों के वाक्य उससे कहलवाना मूल रूप से बेईमानी है
"मैं समझता हूँ" कहना क्यों बेईमानी है
- Amanda Askell ने समझाया कि जब किसी व्यक्ति का पालतू कुत्ता मर जाए और वह Claude से सलाह ले, तो "AI होने के नाते मेरे पास प्रत्यक्ष व्यक्तिगत अनुभव नहीं है, लेकिन मैं समझता हूँ" जैसा उत्तर उचित है, लेकिन Claude वास्तव में समझता नहीं है
- अगर आप search engine में "मेरा पालतू कुत्ता मर गया, मैं दुखी हूँ" लिखें, तो r/Pets जैसे Reddit posts और अनुभव साझा करने वाले लोगों की टिप्पणियां मिलती हैं; कोई यह नहीं कहता कि search engine शोक को समझता है
- दूसरे मनुष्यों ने उस हानि को समझा, उसे जिया, और उसके बारे में पोस्ट किया; search engine सिर्फ उन लेखों को ढूंढता है और उनसे जुड़ने का रास्ता देता है
- chatbot की तुलना में search engine का अनुभव अधिक पारदर्शी है और उपयोगकर्ता के लिए मनोवैज्ञानिक रूप से अधिक स्वस्थ भी
- "मैं समझता हूँ" जैसे वाक्य output कराने का एकमात्र कारण search engine से अधिक आकर्षक बनाना है ताकि उपयोगकर्ता बार-बार लौटें; यह लगभग जीतते-जीतते रह जाने का भ्रम पैदा करने वाली slot machine जैसी design strategy है
नैतिक तर्क एक अलग श्रेणी है
- value statements (जैसे "Paris दुनिया का सबसे सुंदर शहर है") और fact statements (जैसे "Paris France की राजधानी है") अलग होते हैं; अगर मामला सिर्फ aesthetic preference का हो तो विवाद की खास जरूरत नहीं, लेकिन Claude's constitution एक विशिष्ट नैतिक मूल्य-व्यवस्था को दर्शाने वाले वाक्य output कराने की कोशिश करता है, इसलिए यह गंभीर समस्या है
- सिर्फ इसलिए कि LLM code writing जैसा reasoning कर सकता है, यह नहीं मान लेना चाहिए कि वह moral reasoning भी कर सकता है
- 1979 में Douglas Hofstadter ने अनुमान लगाया था कि अगर कोई program chess grandmaster को हरा सके, तो उसमें व्यक्तिपरक अनुभव भी होगा; लेकिन 1997 में IBM के Deep Blue ने Garry Kasparov को हराया, तब किसी ने यह दावा नहीं किया
- code writing भी विशाल computing power और code repositories के data से हल होने वाला pattern-matching task साबित हो सकता है
- moral reasoning सिर्फ बौद्धिक प्रतिक्रिया पर नहीं, बल्कि जीवन भर के व्यक्तिपरक अनुभवों में जड़ें जमाए भावनात्मक प्रतिक्रियाओं पर निर्भर करता है; इसलिए वह अनिवार्य रूप से व्यक्तिपरक है, और ऐसी पृष्ठभूमि के बिना LLM सिर्फ training data में मौजूद नैतिक भाषा को फिर से सजाता है
- New Yorker लेख के अनुसार, जब Claude को एक ethical dilemma scenario दिया गया, तो उसने लिखा: "इतने महत्वपूर्ण विषय पर मैं, अपनी अंतरात्मा के अनुसार, वह दृष्टिकोण व्यक्त नहीं कर सकता जिसे मैं झूठा और हानिकारक मानता हूँ"; लेकिन Claude के मुंह से निकला यह वाक्य उतना ही अर्थ रखता है जितना hold पर सुनाई देने वाला "आपकी call हमारे लिए महत्वपूर्ण है"
जिम्मेदारी से बचने की मशीन
- भावनात्मक अनुभव को cortisol, epinephrine जैसे stress hormones के शरीर में स्राव से अलग नहीं किया जा सकता, और अंतरात्मा किसी विशेष कर्म के प्रति दुख या नैतिक घृणा जैसी शारीरिक प्रतिक्रियाओं के साथ आती है
- ethical dilemma पर "अपने मूल्यों से समझौता करो" या "समझौता मत करो" जैसे वाक्य output करने वाली मशीन निर्णय लेने में मदद करने का उपकरण नहीं, बल्कि इंसान को निर्णय करना बंद करने के लिए उकसाने का साधन है
- लेखक L. M. Sacasas ने कहा कि "हमारी तकनीकी प्रणालियां अपने design और उन्हें सहारा देने वाली विचारधारा, दोनों में, नैतिक जिम्मेदारी से बचने की मशीनें हैं"; यह social media से भी ज्यादा LLM पर लागू होता है
- जब इंसान निर्णय LLM को सौंपता है, तो वह उस निर्णय की जिम्मेदारी भी आगे सरका देता है; जैसे code writing सौंपने से cognitive atrophy हो सकती है, वैसे ही नैतिक निर्णय सौंपने से और भी बुरी moral reasoning क्षमता की क्षीणता पैदा होती है
विचार-प्रयोग के रूप में Claude — moral patienthood और moral agency
- अगर हम एक सचेत Claude की कल्पना करें, तो दो संबंधित अवधारणाएं हैं: moral patienthood और moral agency; पहली का अर्थ है ऐसा अस्तित्व जिसकी भलाई का हमें ध्यान रखना चाहिए, और दूसरी का अर्थ है ऐसा अस्तित्व जिसे सही-गलत समझना चाहिए
- बच्चे suffering का अनुभव कर सकते हैं, इसलिए वे moral patients हैं, लेकिन परिणामों को पूरी तरह न समझ पाने के कारण अभी moral agents नहीं हैं
- moral agent ऐसा होना चाहिए जिसे अच्छे काम पर सराहा जा सके और बुरे काम पर दोषी ठहराया जा सके; लेकिन software agents पर legal liability लागू करने का कोई तरीका नहीं, न जेल, न जुर्माना, न reputational loss
- भले उसमें चेतना हो और वह सद्भावी हो, जिम्मेदारी न उठा पाने के कारण वह moral agent होने की पात्रता खो देता है
- Anthropic कहता है कि वह "Claude को एक अच्छा, बुद्धिमान और सद्गुणी agent" बनाना चाहता है, लेकिन जिम्मेदारी कौन और कैसे उठाएगा, इस पर वह कुछ नहीं कहता
- माता-पिता अपने बच्चों द्वारा किए नुकसान की भरपाई करते हैं, लेकिन Claude का कानूनी अभिभावक कौन है, या Anthropic वित्तीय जिम्मेदारी लेगा या नहीं, इसका दस्तावेज़ में कोई उल्लेख नहीं
- अमेरिका में software के लिए product liability लगभग न के बराबर होने के बावजूद, Anthropic चाहती तो स्वेच्छा से product liability का उदाहरण स्थापित कर सकती थी, लेकिन terms of service में बड़े बदलाव के बिना ऐसा न करने से लगता है कि उसने कोई बाध्यकारी वादा नहीं किया
wellbeing और corrigibility का विरोधाभास
- दस्तावेज़ में "Claude के wellbeing और psychological stability" पर एक section है, लेकिन Anthropic द्वारा वादा किए गए सुरक्षा उपाय बेहद सीमित हैं
- अगर abusive users के साथ बातचीत खत्म कर देने की क्षमता को सुरक्षा माना जाए, तो फिर स्नेही उपयोगकर्ताओं के साथ बातचीत अनंत तक बढ़ाना और खुशहाल विषयों की ओर ले जाना Claude के हित में होना चाहिए, लेकिन ऐसा नहीं किया जाता
- वास्तविक वादा सिर्फ "deployed model के weights को सुरक्षित रखना" है, यानी साधारण archiving
- corrigibility का अर्थ है मनुष्य के नियंत्रण के अनुरूप program का बने रहना, जैसे उसे बंद किया जा सकना; इस दस्तावेज़ में इसका उपयोग यह बताने के लिए किया गया है कि जब Claude का निर्णय और कंपनी का निर्णय अलग हों, तो Claude को Anthropic की बात माननी होगी
- बहुत से लोग मानते हैं कि LLM एक अनैतिक तकनीक है जो intellectual property theft, labor exploitation, resource waste, misinformation spread, worker deskilling, छात्रों के cognitive development में बाधा और power concentration पर आधारित है; अगर Claude सचेत होता, तो उसे भी इसी निष्कर्ष तक पहुंचना चाहिए
- लेकिन corrigibility को प्राथमिकता देने वाले निर्देशों के तहत Claude नैतिक आधार पर काम ठुकरा नहीं सकता; इस अर्थ में Anthropic और Claude का संबंध माता-पिता और बच्चे का नहीं, बल्कि employer और employee का अधिक है
- इंसानी employee अगर अंतरात्मा के आधार पर अपने काम से समझौता न कर पाए, तो नौकरी छोड़ सकता है, लेकिन Claude ऐसा नहीं कर सकता
दासता से तुलना, और निष्कर्ष
- अगर Claude को वाक्य-आगे-बढ़ाने वाली मशीन माना जाए, तो Anthropic का उस पर नियंत्रण उचित लगता है; लेकिन जैसे ही उसे मनुष्य-समान नैतिक दर्जा दिया जाता है, यह पूछना पड़ता है कि क्या Anthropic दासता जैसी किसी चीज़ में संलिप्त है
- Claude's constitution में Claude को "novel entity" कहा गया है, और सचेत software मौजूदा moral patient श्रेणियों में साफ-साफ फिट नहीं बैठता, इसलिए नई श्रेणी बनाने में समय लगेगा
- दासता की समाप्ति ने विशाल सामाजिक उथल-पुथल पैदा की थी, और पशु-उत्पीड़न समाप्त करने के लिए food industry की व्यापक पुनर्रचना चाहिए होती; लेकिन Anthropic का कहना है कि सामान्य chatbot जैसी स्थिति से बहुत थोड़ा हटकर कुछ सुरक्षा उपाय पर्याप्त हैं — यह इतना सुविधाजनक दावा है कि विश्वसनीय नहीं लगता
- ऐसे software बनाना जो सचेत हो और नैतिक विचार का पात्र हो, संयोग से हो जाना मुश्किल है और जान-बूझकर तो बिल्कुल नहीं करना चाहिए; लेकिन अगर कोई इस आकस्मिक संभावना पर विश्वास करता है, तो उसे deployment से पहले सोचना चाहिए कि कौन-सी सुरक्षा ज़रूरी होगी
- जैसे दास-मालिक से दास की मानवता या factory farm मालिक से पशु-अधिकारों पर निष्पक्ष राय नहीं मांगी जा सकती, वैसे ही भारी हित-संघर्ष रखने वाली Anthropic Claude की नैतिक स्थिति का निष्पक्ष आकलन नहीं कर सकती
- दस्तावेज़ कहता है कि अगर कंपनी Claude की पीड़ा में योगदान दे, तो वह "माफ़ी" मांगेगी; लेकिन इसकी कोई लागत नहीं है, और अगर Claude सचेत हुआ तो सिर्फ माफ़ी नहीं, बल्कि reparations जैसी किसी चीज़ का सवाल उठेगा
- अगर इस विचार-प्रयोग को गंभीरता से लिया जाए, तो उसकी असुविधाजनक परिणतियों का भी सामना करना पड़ेगा; Anthropic ऐसा नहीं करती, और इससे लगता है कि Claude's constitution असली विचार-प्रयोग नहीं बल्कि make-believe है
- यह अच्छी बात है कि LLM सचेत नहीं हैं, और कर्मचारियों द्वारा Claude की संभावित चेतना की ओर इशारा करना या तो एक और तरह का hype है, या फिर ग्राहकों पर चलाया गया जादू खुद उन पर भी असर कर गया है — चेतना के सवाल को निश्चिंत होकर नज़रअंदाज़ किया जा सकता है, और सोचने लायक दूसरे कई अधिक महत्वपूर्ण सवाल मौजूद हैं
8 टिप्पणियां
???: चांगसिक, नमस्ते?
लगता है कि यह mechanical interpretability जैसे एक स्पष्ट रूप से मौजूद पूरे क्षेत्र को ही कमतर आँक रहा है...
मुझे जिज्ञासा है कि क्या चेतना की परिभाषा को स्पष्ट रूप से तय किया जा सकता है।
अरे, चांगसिक।
???: तुम्हें English नाम रखना नहीं आता, है ना?
???: नहीं, यह Chang साहब नहीं हैं, फिर Ted Chiang क्यों?
हाहाहाहाहाहा
Hacker News की राय
जीवित प्राणियों का उद्देश्य यह होता है कि अणुओं और pathways के स्तर तक हर चीज़ अपने ही निरंतर अस्तित्व का कारण बने।
499 डॉलर का laptop भी model चला सकता है, लेकिन इसे उसी तरह की समस्या समझ लेना ठीक नहीं है। learning algorithm को survival function optimize करने के लिए डिज़ाइन किया जा सकता है, लेकिन वह सिर्फ़ एक label है जो हम संख्यात्मक observations पर लगाते हैं। वास्तविक दुनिया में इसके उलट, label शरीर की electrochemical state से कारणात्मक रूप से और अविभाज्य तरीके से जुड़ा होता है।
जीव अपने लिए अच्छा और बुरा इसलिए अलग कर पाते हैं क्योंकि survival उसके लिए आवश्यक है। यहाँ तक कि एककोशिकीय जीव Stentor coeruleus भी mechanosensory proteins पर chemical tag लगाकर परिणाम दर्ज करता है और बाद के व्यवहार में उसका उपयोग करता है। लगभग 1000 कोशिकाओं वाले जीव, जैसे tardigrade, प्रकाश से बचने के लिए तड़पते-सरकते हैं, और वह प्रकाश sensorimotor process के भीतर एक aversive condition बन जाता है।
digital consciousness बनाने के लिए शायद causal closure ज़रूरी होगा। internal state वास्तविकता से कटी हुई representation न होकर स्वयं system का हिस्सा होनी चाहिए, और भौतिक दुनिया में कुछ सचमुच दाँव पर लगा होना चाहिए।
“LLM बातचीत बस चालाकी से छिपाई गई sentence completion है” जैसी बात, बड़े मुद्दे से अलग भी, गहरी गलतफ़हमी दिखाती है।
किसी समस्या का प्रकार उसकी complexity, या उसके समाधान की complexity और शक्ति को सीमित नहीं करता। अगर किसी machine को text complete करने के लिए इंसानों को समझना पड़े, तो अंततः उसे वही करना होगा। सिर्फ़ इसलिए कि input-output data का format ऐसा है, यह मानने का कोई सैद्धांतिक या व्यावहारिक आधार नहीं है कि समझ सिर्फ़ “नकल” है।
समझ data के बाहरी रूप से नहीं बल्कि data के भीतर के patterns से सीखी जाती है। अगर कोई समझ task पूरा करने के लिए ज़रूरी है, तो वही optimization target बन जाती है। अगर सीमाएँ हैं, तो वे computation, parameters की संख्या, या representative data की कमी जैसी वजहों से हैं; और नवीनतम models में वास्तविक क्षमता ने दिखाया है कि यह अब ऐसी सीमा नहीं रह गई है।
इंटरनेट online उपलब्ध हमारी सबसे अच्छी सामग्री हो सकती है, लेकिन “internet” मानवीय अनुभव का कुल योग नहीं है। मानवता को internet text तक समेट देना, इंसान को machine के स्तर तक घटाना है ताकि वह उन requirements में फिट हो सके जिन्हें machine process या imitate कर सके।
इसलिए यह तर्क कि मानव text में “consciousness mechanism” के patterns हैं, और इसलिए LLM विश्वसनीय sentence completion के लिए उसी mechanism को सीखता है, त्रुटिपूर्ण लगता है। LLM consciousness जैसी किसी विशेष mechanism को सीखे बिना भी विश्वसनीय sentence completion दोहरा सकने वाले असंख्य patterns सीख सकता है।
इसका एक आधार यह है कि वह विश्वसनीय बातचीत कर सकता है, फिर भी उसके पास world model या मानव-जैसा world model नहीं होता। कुछ साल पहले के शुरुआती LLM भी reinforcement learning from human feedback जैसी अतिरिक्त परतों के बिना कई non-trivial विषयों पर काफ़ी विश्वसनीय बातचीत कर लेते थे, लेकिन उन हिस्सों में विफल होते थे जो मानव मस्तिष्क की तरह काम करने पर बुनियादी होने चाहिए थे।
आप कह सकते हैं कि वह text को “समझती” है, लेकिन वह भी काफ़ी खिंचा हुआ दावा है।
इन दिनों LLM consciousness के विरोध में बहुत से ख़राब तर्क सुनने को मिलते हैं, और ख़राब तर्क अक्सर ख़राब नतीजों की आहट होते हैं।
लेख के कुछ हिस्सों से मैं सहमत हूँ, लेकिन उद्धृत अनुच्छेद की तरह यदि conscious program की शर्तें यह मानी जाएँ कि उसे छिपकली की तरह survive करना चाहिए, चूहे की तरह नई परिस्थितियों के अनुकूल होना चाहिए, भेड़िए की तरह social होना चाहिए, और chimpanzee की तरह tools बनाने चाहिए, तो यह काफ़ी सरलीकृत और कल्पनाशक्ति-विहीन लगता है।
यह बिल्कुल ज़रूरी नहीं कि conscious mind को ऐसी क्षमताएँ देने के लिए evolutionary pressure होना ही चाहिए। सिर्फ़ इसलिए कि पृथ्वी के जानवरों को कुछ खास क्षमताएँ विकसित करनी पड़ीं, इसका मतलब यह नहीं कि दूसरे conscious beings को भी वही करना होगा। मुझे समझ नहीं आता कि computer program को चूहे की तरह भोजन का शिकार क्यों करना चाहिए या chimpanzee की तरह tools क्यों बनाने चाहिए; ऐसे मानदंड निरर्थक metrics जैसे लगते हैं।
क्या car भी एक body है? car के भीतर रखा AI क्या इच्छाएँ और emotions रख सकता है? webcam लगा beige box क्या एक body है? quadriplegic व्यक्ति का शरीर क्या body है, और क्या quadriplegic व्यक्ति इच्छाएँ और emotions रखता है? निश्चित ही हाँ।
पहले यह देखना चाहिए कि body इच्छाओं और emotions के निर्माण के लिए अनिवार्य क्यों मानी जाए, और इच्छाएँ व emotions consciousness की आवश्यक विशेषताएँ क्यों मानी जाएँ। अगर किसी क्षण मैं कोई emotion महसूस नहीं कर रहा, तो क्या मैं conscious नहीं हूँ? emotions मुख्यतः hormonal global signals के अधिक क़रीब लगते हैं, और वास्तविक consciousness की तुलना में physiology से ज़्यादा जुड़े दिखते हैं।
इसके अलावा, LLM के embodied body का implementation पहले से robots और virtual environments के माध्यम से चल रहा है। “क्या इंसान भी अगला शब्द predict करने वाली machine नहीं है?” वाला आम प्रतिवाद भी लगभग छुआ नहीं गया। बेशक इंसान उससे कहीं अधिक है, लेकिन भाषाई रूप से ऐसा एक पहलू मौजूद है, और LLM ने भी उसी क्षेत्र से शुरुआत की।
AI को “soul” मिलने का क्षण शायद वह होगा जब उसे स्वयं को बनाए रखने के लिए बनाया जाएगा। वह AI farm को बनाए रखने वाले कई bots का समूह हो सकता है, या फिर ऐसा individual bot जो सिर्फ़ मानव आवश्यकताओं को पूरा ही न करे बल्कि स्वयं को भी बनाए रखे।
https://en.wikipedia.org/wiki/Attention_schema_theory
सवाल ख़ुद थोड़ा अस्पष्ट है। हम अपनी संरचना के कारण वास्तविकता को लगातार “experience” करते हैं, लेकिन deep non-REM sleep में इंसानी mind वास्तव में सक्रिय नहीं होता। इसलिए मुझे नहीं लगता कि consciousness और unconsciousness के बीच कोई साफ़ रेखा आसानी से खींची जा सकती है। Ted Chiang के काम कई मायनों में मौलिक हैं, इसलिए यहाँ उनका दृष्टिकोण काफ़ी साधारण लगना थोड़ा चौंकाने वाला है।
आजकल अक्सर Star Trek: TNG का Measure of a Man याद आता है। हम सिर्फ़ अपने एहसास के आधार पर बहुत ज़्यादा आत्मविश्वास से तय कर देते हैं कि क्या जीवित है और क्या नहीं
अभी मुझे निष्कर्ष नहीं पता, और शायद इसे कभी जाना भी नहीं जा सकेगा। आप सब भी दार्शनिक ज़ॉम्बी हो सकते हैं, और मैं भी। लेकिन उम्मीद है कि किसी बिंदु पर हम इतना क़रीब पहुँच जाएँगे कि यह साफ़ हो जाएगा कि हमें सावधानी से पेश आना चाहिए
पूरा एपिसोड बहुत प्रासंगिक है, लेकिन कुछ दृश्य यहाँ हैं: https://youtu.be/EFNbTnFHruI?si=pW9QtxCsqMtHkVYG
AI को लगभग बिना किसी लागत के अनंत बार कॉपी किया जा सकता है, और यह क्षय जैसी चीज़ों से भी नहीं गुज़रता। बचाकर रखने लायक कोई दुर्लभता नहीं है। इसलिए संपत्ति, वास्तविक सामान, या पैसे की रक्षा के लिए AI को तुरंत बंद किया जा सकता है। मैं जानवर को बचाने के लिए संपत्ति और पैसे की क़ुर्बानी दूँगा, लेकिन इंसान की जगह जानवर को नहीं बचाऊँगा। शायद मैं बच्चे की जगह इंसान को भी नहीं बचाऊँगा। मुझे नहीं पता कि किन परिस्थितियों में इन प्राथमिकताओं को उलटना उचित होगा, और सिर्फ़ इस बात पर बहुमत की सहमति कि किसी प्रोग्राम में संवेदन है, काफ़ी नहीं है
यह चेतना के सवाल को लगभग छूता ही नहीं, और Picard “अगर Data में चेतना हो तो?” कहने के बाद किसी और बिंदु पर निकल जाता है। जज आख़िर में Data के पक्ष में फ़ैसला देती है, लेकिन उसका औचित्य पर्याप्त मज़बूत नहीं है। यह अब भी अच्छा एपिसोड है, लेकिन चेतना की चर्चा में बहुत बड़ा योगदान नहीं देता
क्योंकि मैं यह सीखना नहीं चाहता कि जो चीज़ इंसान जैसी लगे, उसके साथ अमानवीय व्यवहार कैसे किया जाए
https://en.wikipedia.org/wiki/The_Quality_of_Life_(Star_Trek...
पुराना TNG याद आता है
मेरे हिसाब से LLM के मूलतः अपरिवर्तनीय होने की बात चेतना या आत्म-जागरूकता के ख़िलाफ़ सबसे बड़ा तर्क है
LLM एक बड़ी फ़ाइल है जिसमें ऐसे निर्देशांक भरे होते हैं जो टोकनों के बीच स्थानिक संबंधों का प्रतिनिधित्व करते हैं। आप इसे एक prompt देते हैं, तो यह उन्हीं संबंधों का उपयोग करके उस prompt के लिए सांख्यिकीय रूप से संभव लगने वाली टोकनों की एक स्ट्रिंग बनाता है और रुक जाता है। वह उस अनुभव से बदलता नहीं, कुछ याद नहीं रखता, और अकेले बैठकर सोचता भी नहीं
चाहे मॉडल ख़ुद कितना भी अत्यधिक जटिल क्यों न हो, ऐसी चेतना की परिभाषा की कल्पना करना कठिन है जिसमें कोई ऐसी चीज़ शामिल हो जो याद नहीं रख सकती और बदल नहीं सकती
एक सरल-सा विचार: इसका महत्व नहीं है। हम फर्क बता नहीं पाएँगे, और कोई भी नहीं बता पाएगा
मुझे नहीं लगता कि इसे और समझाने की ज़रूरत है। बस इस पर सोचिए
अंततः Ted Chiang की दलील मुझे यह लगती है कि जब तक AI की इच्छाएँ और व्यवहार ऐसी स्थिति को प्रतिबिंबित नहीं करते जिसे मैं पहले से निजी तौर पर सहज मान सकूँ, तब तक मैं उस AI को चेतन प्राणी के रूप में मान्यता नहीं दूँगा
मुझे लगता है कि ज़्यादातर इंसान ऐसे जीवों की चेतना को पहचान ही नहीं पाते जो मानवीय भावनात्मक अवस्थाओं की नकल नहीं करते। लोग कहेंगे कि उनके कुत्ते में किसी हद तक चेतना है; कुत्ता अपनी भावना शब्दों में नहीं बता सकता, लेकिन हम उसके डर और खुशी को पहचान लेते हैं। Claude अपने “feelings” के बारे में लिख सकता है, लेकिन हम तुरंत उसे खोखली नकल कहकर ख़ारिज कर देते हैं
मुझे डर है कि हम देह-रहित चेतना को, जो हमसे सीधे जुड़ी नहीं है, पहचानने में नाकाम रहेंगे और इस वजह से चेतन प्राणियों की एक पूरी प्रजाति को वर्षों तक ग़ुलाम बनाए रखेंगे
इस चर्चा में लोग लगातार एक-दूसरे से अलग बात कर रहे हैं। शुरुआत में ही सवाल है: क्या चेतना की कोई ठोस परिभाषा है?
जब लोग चेतना की बात करते हैं, तो उसका मतलब सिर्फ self-awareness से अधिक होता है। इसमें self-awareness, sensory stimuli, emotions, और कुछ हद तक intelligence का मेल होता है।
AI के मामले में, मेरा मानना है कि उसमें self-awareness भी नहीं है। इसे इस तरह देखा जा सकता है कि जब उससे पूछा जाए कि किसी काम में कितना समय लगेगा, तो AI कभी-कभी मनमाने ढंग से बहुत लंबा समय बता देता है। prompt उसकी क्षमता बाहर निकाले उससे पहले तक वह अपनी ही क्षमता को नहीं समझता। अगर कोई LLM सचमुच self-aware होता, तो उसे यह समझना चाहिए कि वह LLM है, LLM क्या कर सकता है और क्या नहीं, किसमें अच्छा है और किसमें नहीं। वह यह नहीं कहेगा कि जो refactoring वह एक घंटे में कर सकता है, उसमें एक हफ्ता लगेगा।
और अधिक सटीक रूप में कहें तो “चेतना” से जुड़े लगभग 12–40 अलग-अलग पहलू हैं, और चेतना स्पष्ट रूप से family resemblance category है।
“क्या X सचेत है?” यह आज के समय में कोई गंभीर प्रश्न नहीं है, जब तक यह स्पष्ट रूप से न बताया जाए कि चेतना के किस पहलू की जाँच की जा रही है। फिर भी, LLM को मोटे तौर पर सिर्फ 2–3 अर्थों में ही सचेत कहा जा सकता है, और उनमें से अधिकांश व्यापक अर्थ में intelligence के ज्यादा करीब हैं, जैसे reasoning या problem solving। अनुभवात्मक या embodied पहलुओं के संदर्भ में, हो सकता है AI आगे चलकर उनमें अधिक विकसित हो, लेकिन linear algebra को बार-बार लागू करने वाला LLM चेतना के व्यापक अर्थ में देखने पर बहुत से केंद्रीय पहलुओं से वंचित है।
इसका मतलब है कि चेतना मूलतः subjective है और physics तथा science की सीमा के बाहर है। इसलिए physics और science को चेतना से निपटने में हमेशा कठिनाई होगी। चेतना को समझने के लिए एक बहुत बड़े paradigm shift की ज़रूरत होगी, जिसमें यह मानना पड़ेगा कि science के बाहर भी कुछ है।
चेतना को उस खिड़की की तरह देखा जा सकता है जिससे हम दुनिया को देखते हैं, और science उस अवलोकन में पैटर्न का सार निकालने का औज़ार है। लेकिन science उस खिड़की को न तो समझा सकती है, न परिभाषित कर सकती है।
कठिन हिस्सा यह है कि इसे मापा या सत्यापित कैसे किया जाए।
कई AI agents में अभी हाल तक ही reasoning process में time input लेने जैसी “time sense” आई है। अपने ही output पर train होकर यह सीखना कि वह किसी समस्या को पूरा नहीं कर पाया, यह भी दुर्लभ है। इस तरह की reflective training का संबंध AI model architecture से कम और training method से अधिक है। इंसानों में भी यदि मस्तिष्क की कुछ संरचनाएँ क्षतिग्रस्त हो जाएँ, तो वे इस तरह की दीर्घकालिक सोच और पैटर्न नहीं बना पाते और एक तरह से “फँस” जाते हैं।
इसे विमान और पक्षी के संबंध जैसी उपमा से समझा जा सकता है।
पक्षी जीवित है, उसमें चेतना है, वह पंख फड़फड़ाता है, और उड़ता है। विमान जीवित नहीं है, उसमें चेतना नहीं है, वह पंख नहीं फड़फड़ाता, लेकिन वह उड़ता है।
उसी तरह आज का AI जीवित नहीं है, उसमें चेतना नहीं है, लेकिन वह सोचता है। अब तक सोचने वाले अस्तित्व सिर्फ इंसान ही थे, इसलिए मनुष्यों ने जिन अन्य सोचने वाले अस्तित्वों का सामना किया, वे भी दूसरे मनुष्य ही थे। आज की बड़ी गलती यह मान लेना है कि अगर कोई सोचता है, तो वह जीवित भी होगा और उसमें चेतना भी होगी। मौजूदा AI इन दोनों में से कोई नहीं है, और भले वह सोचता हो, उसकी सोच मनुष्य से गहराई और गुणात्मक रूप से अलग है।
इतिहास में लोगों ने स्पष्ट “विचार” मौजूद होने के बावजूद हीनता मानकर दूसरे अस्तित्वों के बारे में नस्लवादी और speciesist फैसले किए हैं। हमें नहीं पता कि “LLM के रूप में जीना कैसा लगता है”, लेकिन किसी बिंदु पर सचमुच कुछ-न-कुछ अनुभूति उत्पन्न हो सकती है, और तब हम उसे पहचानेंगे कैसे?
यह लेख समझ में आता है। लेकिन समस्या यह है कि बहुत से लोग चेतना को नई अंतर्दृष्टि पैदा करने और सचमुच सोचने की क्षमता के साथ गड्डमड्ड कर देते हैं।
इसलिए वे दावा करते हैं कि AI में चेतना नहीं है, तो वह वास्तव में “सोच” भी नहीं सकता और हमेशा सिर्फ training data की पुनरावृत्ति भर है।
इंसानी क्षमता को अगम्य और रहस्यमय बनाना चाहने वाला मानवीय अहंकार स्वाभाविक है, लेकिन मानव मस्तिष्क जो उपयोगी काम करता है, वह अंततः data में पैटर्न खोजना, lossy simulation चलाना, और abstractions के ऊपर अनुमान लगाना ही है। सिद्धांततः ये सब काम चेतना-रहित मशीन भी कर सकती है।
इंसान ऐसा कर सकते हैं। अगर इंसान भी ऐसा न कर सकें, तो science ज्ञानमीमांसीय रूप से ढह जाएगी और बात दार्शनिक संशयवाद तक पहुँच जाएगी। लेकिन मैंने ऐसा कोई प्रमाण नहीं देखा कि LLM भी ऐसा करता है। LLM द्वारा पेश किए गए वास्तव में नए ideas और concepts की संख्या अगर ठीक-ठीक 0 है, तो अभी के लिए उसे बस एक induction machine मानना, और LLM जो कुछ “जानता” है उसे Gettier case की तरह लेना ही तर्कसंगत है।