- Silicon Valley में AGI (Artificial General Intelligence) को एक हासिल किए जा सकने वाले लक्ष्य के रूप में मानने वाली संस्कृति फैल रही है
- OpenAI के भीतर ‘pure language hypothesis’ के आधार पर यह विश्वास बना कि language model को scale करने से AGI तक पहुँचा जा सकता है
- यह विश्वास विशाल data center expansion और environmental व labor exploitation जैसी समस्याओं को जायज़ ठहराने के आधार के रूप में काम करता है
- AGI की expected value (EV) वाली तर्कशृंखला बिना आधार वाली probability और value estimation पर निर्भर करती है, और वास्तविक environmental damage व social cost को नज़रअंदाज़ करती है
- AGI के भ्रम को छोड़कर छोटे, purpose-driven models के साथ समस्याएँ हल करने वाला व्यावहारिक engineering approach ज़रूरी है
AGI में विश्वास और OpenAI की संस्कृति
- OpenAI से जुड़े लोग वास्तव में यह मानते हैं कि AGI मानवता की समृद्धि या विनाश ला सकती है
- Elon Musk ने Demis Hassabis को “दुनिया पर राज करना चाहने वाला villain” बताया, और OpenAI को “good” तथा DeepMind को “evil” के रूप में पेश किया
- Ilya Sutskever ने कर्मचारियों से “AGI को महसूस करो (Feel the AGI)” कहा, और AGI का प्रतीक माने जाने वाले लकड़ी के पुतले को जलाने की रस्म करवाई
- ये घटनाएँ दिखाती हैं कि science fiction जैसी कल्पना Silicon Valley की मुख्यधारा की मान्यता बन चुकी है
‘pure language hypothesis’ और LLM scaling
- Karen Hao की किताब Empire of AI के अनुसार, GPT-2 ‘pure language hypothesis’ पर आधारित था
- चूँकि इंसान भाषा के माध्यम से सोचते और संवाद करते हैं, इसलिए केवल language data से AGI संभव है — यह इसका आधार है
- इसके विपरीत ‘grounding hypothesis’ कहती है कि AGI को दुनिया को प्रत्यक्ष रूप से समझना चाहिए
- GPT से GPT-2 तक की सफल scaling ने OpenAI के भीतर यह विश्वास मज़बूत किया कि ज़्यादा data, model parameters और compute resources से AGI तक पहुँचा जा सकता है
scaling की दौड़ और environment·labor समस्याएँ
- AGI में विश्वास और LLM की उपलब्धियों ने बड़े पैमाने पर data center निर्माण को जायज़ ठहराया
- कुछ facilities हर सेकंड सैकड़ों लीटर पानी इस्तेमाल करती हैं, और बिजली की कमी के कारण प्रदूषण फैलाने वाले gas generators चलाती हैं
- इससे पूरे शहर के स्तर की बिजली खपत और CO₂ उत्सर्जन में वृद्धि होती है
- ChatGPT का output सुरक्षित बनाने के लिए data moderation और cleaning का काम करने वाले workers को शोषण और मानसिक trauma झेलना पड़ता है
- data demand बढ़ने पर पूरे internet से अंधाधुंध collection किया जाता है, और RLHF (Reinforcement Learning from Human Feedback) से output को नियंत्रित किया जाता है
expected value तर्क की समस्या
- AGI development को सही ठहराने के लिए अक्सर expected value (EV) का हवाला दिया जाता है
- तर्क यह है कि “अगर 0.001% संभावना से भी बहुत बड़ा मूल्य पैदा हो, तो EV बहुत बड़ा होगा”
- लेकिन ऐसी गणना में probability और value मनमाने होते हैं और सत्यापित नहीं किए जा सकते
- दूसरी ओर, environmental destruction और social cost निश्चित नकारात्मक मूल्य और वर्तमान में होने वाली क्षति के रूप में मौजूद हैं
वास्तविक engineering की ओर बदलाव
- engineers को समस्याएँ प्रभावी, कुशल और बिना नुकसान पहुँचाए हल करनी चाहिए
- LLM को AGI मानने वाला approach इन तीनों कसौटियों पर विफल होता है
- इससे अत्यधिक compute waste, labor exploitation, और environmental damage पैदा होता है
- AGI के भ्रम से बाहर निकलकर, LLM और generative models को विशिष्ट समस्याओं को हल करने वाले tools के रूप में परखा जाना चाहिए
- छोटे, purpose-driven generative models या non-generative (discriminative) models का उपयोग
- cost-benefit analysis और technical trade-offs के आधार पर व्यावहारिक engineering की ज़रूरत है
3 टिप्पणियां
Hacker News राय
AI संदेहवादियों को मेरी सलाह है कि डेटा सेंटर के पानी के उपयोग वाली बहस से बचना बेहतर है
“हर साल लाखों लीटर” जैसी अभिव्यक्तियाँ संदर्भ के बिना डरावनी लगती हैं, लेकिन कृषि या गोल्फ कोर्स से तुलना करें तो यह बहुत कम है
ऊर्जा उपयोग, CO₂ उत्सर्जन जैसी चर्चाएँ ठीक हैं, लेकिन केवल पानी के उपयोग पर ज़ोर देने से पूरे तर्क की विश्वसनीयता घटती है
हालाँकि बाद में मुझे पता चला कि डेटा सेंटर अक्सर ऐसा पीने योग्य पानी इस्तेमाल करते हैं जिसे कृषि में उपयोग नहीं किया जा सकता
फिर भी, ‘लाखों गैलन’ जैसे आँकड़े बिना संदर्भ के पेश करना अब भी मुझे एक anti-pattern लगता है
यह तकनीकी चर्चा नहीं, बल्कि पहचान की राजनीति में बदल जाने का नतीजा लगता है
HN पर राजनीतिक रुख छोड़कर तकनीकी आधार पर बहस करनी चाहिए
शायद AI प्रचार की अतिशयोक्ति के खिलाफ प्रतिक्रिया के रूप में यह रवैया पैदा हुआ है
उल्टा यह तर्क दिया कि यदि बड़े पैमाने पर माँग पैदा होती है, तो स्थानीय जल अवसंरचना का विस्तार होगा और पीने के पानी की कीमत कम हो सकती है
उनके अतिरिक्त विचार के अनुसार, “AI केवल कीमती पानी ही इस्तेमाल करता है” वाली आलोचना वास्तव में स्थिति को उल्टा समझती है
चिली के एक शहर में Google डेटा सेंटर ने स्थानीय सूखे को और बदतर बना दिया था,
और दूसरे इलाकों में स्थिति इतनी गंभीर थी कि समुद्री पानी को पीने के पानी में मिलाना पड़ा
किसी पूरे शहर के उपभोग के बराबर पानी इस्तेमाल करना स्पष्ट रूप से समस्या है
गोल्फ कोर्स और डेटा सेंटर, दोनों को externalities की कीमत चुकानी चाहिए,
और अगर शुष्क क्षेत्रों में वे आर्थिक रूप से व्यावहारिक नहीं हैं, तो वही बेहतर है
जो पानी खेती में इस्तेमाल हो सकता है, वही cooling में भी इस्तेमाल हो सकता है
ऊर्जा उपयोग का मुद्दा भी कुछ हद तक बढ़ा-चढ़ाकर पेश किया गया है — अंततः सस्ती renewable energy ही प्रतिस्पर्धी होगी
मुझे लगता है कि LLM की सीमा हार्डवेयर की समस्या है
मानव मस्तिष्क के न्यूरॉन एक साथ हजारों input और output संभालते हैं, लेकिन LLM न्यूरॉन के पास केवल एकल input-output होता है
मानव मस्तिष्क लगभग 20W पर काम करता है, जबकि LLM को कई MW चाहिए
GPU या TPU से AGI तक पहुँचना मुश्किल है, और पूरी तरह नए हार्डवेयर paradigm की ज़रूरत है
यह सिर्फ compute की कमी का सवाल नहीं है
केवल बौद्धिक गतिविधि के लिए बने वातावरण में शायद इतने अधिक न्यूरॉन की ज़रूरत न हो
समस्या पैमाने की नहीं बल्कि placement structure (Electronic Design Automation) की है
EDA wiki article देखें
मस्तिष्क के पास कई input pathways और अलग-अलग signal methods हैं, और design complexity भी कहीं अधिक है
AGI का विमर्श धार्मिक आवेग का विस्तार लगता है
इंसान अब भी ऐसी पूर्ण समाधान की लालसा रखता है जो हर समस्या हल कर दे
इसे दबाओ तो यह और बुरी शक्ल में लौटती है
ध्यान, संयम, और दूसरों के प्रति नैतिकता जैसी निजी मान्यताएँ ही मेरा ‘धर्म’ हैं
यह सूरज या मस्तिष्क जैसे प्राकृतिक तंत्रों को तकनीक से दोहराने की कोशिश है
धर्म की तरह, सत्ता संरचनाएँ विश्वास का इस्तेमाल नियंत्रण बनाए रखने के लिए करती हैं
मानव की अंधभक्ति और धोखाधड़ी हर दौर में दोहराई जाती है
संदर्भ: Extraordinary Popular Delusions and the Madness of Crowds
धर्म के लुप्त होने वाले समाज पहले केवल मूल्यों का बचा हुआ खोल वाले चरण से गुजरते हैं,
फिर धर्महीनता के चरण में गिरते हैं और नैतिक शून्य पैदा होता है
कुछ लोग AI के सामने समर्पण करना चाहते हैं, लेकिन “AI ने कहा है” एक प्रेरणाहीन आस्था है
मैं भी एक इंजीनियर के रूप में कुशल और हानिरहित समस्या-समाधान चाहता हूँ, लेकिन हक़ीक़त जटिल है
Raspberry Pi पर Bluetooth सेटअप करते समय मैंने GPT और Claude की मदद से समस्या हल की
Stack Overflow और forums पहले जितने सक्रिय नहीं रहे, और documentation भी बिखरा हुआ है
तकनीक इतनी जटिल हो गई है कि आखिरकार LLM पर निर्भर होना पड़ता है
दीर्घकाल में AI के बिना चल न सकने वाला समाज टिकाऊ नहीं हो सकता
तकनीक को फिर से सरलता की ओर लौटना होगा
उदाहरण के लिए ArchWiki Bluetooth या Debian BluetoothUser देखें
कंपनियों में पहले से ही ऐसी संरचना बन रही है जहाँ AI agents tools को इंसानों की जगह चलाते हैं
अंततः यह बड़ा जोखिम है कि इंसान अंदर की logic को समझना ही बंद कर दें
लेकिन इंसानों को पूरी तरह बदलने के लिए अभी भी इनमें मूलभूत सीमाएँ हैं
आखिरकार LLM के भी उसी रास्ते पर जाने की संभावना है
उद्योग का एक हिस्सा कहता है कि LLM एक मूलभूत dead end हैं,
लेकिन शेयर और प्रतिष्ठा के चक्कर में लोग वास्तविकता स्वीकार नहीं कर रहे
उसी तरह LLM भी AGI तक पहुँचने की मध्यवर्ती तकनीक हो सकता है
यह AGI system का मुख्य घटक भी बन सकता है
Whisper की वजह से मेरे लिए वीडियो subtitle का काम क्रांतिकारी रूप से छोटा हो गया
जो काम पहले घंटों लेता था, वह अब कुछ मिनटों में हो जाता है
अच्छे UI वाले MacWhisper की वजह से इसकी पहुँच भी बढ़ी है
उदाहरण के लिए, वकीलों द्वारा LLM से निर्दोषता साबित करने वाले सबूत ढूँढने के मामले भी हैं
अति-विस्तार के बजाय व्यावहारिक उपयोग महत्वपूर्ण है
कुछ ही वर्षों में ऐसा समय आएगा जब personal LLM laptop स्तर पर चलेंगे
content moderators का शोषण कहा जाना मुझे अतिशयोक्ति लगता है
यह internet moderation work 30 साल पहले से मौजूद है
यह अप्रिय हो सकता है, लेकिन न नया है, न अभूतपूर्व रूप से भयावह
AGI की खोज से अलग, यह ज़रूरी भूमिका है
AI पर यथार्थवादी चर्चा देखकर अच्छा लगता है
बात यह नहीं कि transformer तकनीक खुद बेकार है,
समस्या “जल्द ही AGI आ रहा है” वाली अत्यधिक अतिशयोक्ति है
HN ने ज़्यादातर trends को अच्छी तरह झेला है, लेकिन इस बार यह अपवाद जैसा लगता है
हमें आसान होने की वजह से नहीं, बल्कि कठिन होने की वजह से चुनौती लेनी चाहिए
भले AGI भ्रम हो, उस प्रक्रिया में उपयोगी समस्याएँ हल की जा सकती हैं
डेटा सेंटर के carbon emissions को लेकर बहुत-सी बातें बढ़ा-चढ़ाकर कही जाती हैं,
और दीर्घकाल में clean-energy आधारित data centers अधिक किफायती होंगे
यह आम लोगों पर सीधा बोझ है
मौजूदा AI इस कसौटी पर बहुत विश्वसनीय नहीं लगता
DeepMind और Demis Hassabis वास्तव में वैज्ञानिक उपलब्धियाँ दे रहे हैं
उदाहरण: AlphaFold, AlphaEvolve आदि
ऐसे शोध मौजूद होने पर बस यह कहना कि “AI एक भ्रम है” उचित नहीं है
लेख का मुख्य बिंदु AGI के प्रति जुनून की आलोचना करना है
Hassabis वास्तव में विज्ञान की प्रगति में रुचि रखते लगते हैं
जबकि कुछ कंपनियाँ केवल पैसा कमाने वाले PR जैसी लगती हैं
AGI की बात हो रही है, लेकिन सब लोग बस यही बता रहे हैं कि उन्होंने खुद क्या किया है।
इंजीनियरिंग की बात करते समय पर्यावरण या श्रम शोषण जैसी अजीब बातें उठाने के बजाय,
बेहतर होगा कि साफ़ तौर पर रिपोर्ट लिखें कि यह बर्बाद होने वाला है, और short करने जैसा व्यवहार भी दिखाएँ..