- Greg Brockman का मानना है कि OpenAI को AGI मिशन हासिल करने के लिए गैर-लाभकारी सीमाओं से आगे बढ़कर for-profit entity और बड़े पैमाने की compute क्षमता सुनिश्चित करनी पड़ी
- OpenAI के तकनीकी turning point में Dota में PPO scaling, language models की semantic learning, और GPT-4 के बाद AGI के मानदंडों की दोबारा समीक्षा शामिल रही
- AI development पहले से ही AI की मदद से तेज़ हो रहा है, और code writing तेज़ी से replace हो रही है, लेकिन code structure design में इंसानी experts अभी भी मज़बूत माने जाते हैं
- आगे सबसे बड़ी बाधा compute होगी, और OpenAI data centers तथा free accessibility के ज़रिए तकनीक के लाभ को व्यापक रूप से बाँटना चाहता है
- Iterative deployment, safety, neutrality, और regulation सभी product और समाज के लिए मुख्य चुनौतियाँ हैं, और सफलता का मानदंड यह है कि AGI पूरी मानवता के लिए लाभकारी हो
OpenAI की स्थापना और संरचना में बदलाव
-
Stripe के बाद AI की ओर जाने की वजह
- Greg Brockman को लगा कि Stripe में जिन समस्याओं पर वह काम कर रहे थे, वे ऐसी नहीं थीं जिनसे वह पूरी ज़िंदगी जुड़े रहना चाहें, और अगर वह AI के दुनिया में विकसित होने के तरीके पर असर डाल सकें, तो वह एक अर्थपूर्ण जीवन होगा
- जब Brockman Stripe छोड़ने की सोच रहे थे, तब Patrick Collison ने उनसे Sam Altman से बात करने को कहा, और Sam ने कुछ ही मिनटों में समझ लिया कि Brockman पहले ही जाने का फैसला कर चुके हैं
- जब Brockman ने कहा कि वह एक AI कंपनी के बारे में सोच रहे हैं, तो Sam ने भी कहा कि वह AI में कुछ शुरू करना चाहते हैं, और संपर्क में बने रहने की यह बात 2015 में research lab स्थापित करने की चर्चा तक पहुँची
-
2015 में research lab की स्थापना और शुरुआती टीम
- उस समय DeepMind एक “10,000-pound gorilla” जैसा दिखता था, जिसके पास researchers, capital, data, और track record सब कुछ था, और AlphaGo के सार्वजनिक होने से पहले भी उसकी momentum साफ़ थी
- मुख्य सवाल यह था: “क्या बहुत से top researchers को इकट्ठा कर research lab शुरू करने में बहुत देर हो चुकी है, या यह अब भी संभव है?” — इसके कठिन होने के बहुत कारण थे, लेकिन इसे असंभव नहीं माना गया
- Sam Altman और Brockman इस निष्कर्ष पर पहुँचे कि “इसे करना चाहिए”, और Brockman अगले ही दिन से full-time संगठन बनाने में जुट गए
- शुरुआती योजना में Ilya Sutskever, Dario Amodei, Chris, Greg Brockman शामिल थे, लेकिन यह पूरी तरह साकार नहीं हो पाई; Chris Google Brain चले गए और John Schulman जैसे लोगों ने रुचि दिखाई
- लगभग 10 लोग इस स्थिति में थे कि “और कौन साथ जुड़ रहा है?”, तब Sam ने एक offsite का सुझाव दिया और Napa में बिना आधिकारिक offer, organizational structure, या पक्के joining members के लोगों को इकट्ठा किया
- Napa offsite में ऐसी दिशा सामने आई जो बाद के 10 वर्षों तक चलने वाली तकनीकी योजना के काफ़ी करीब थी, और उसका केंद्र था reinforcement learning को solve करना, unsupervised learning को solve करना, और धीरे-धीरे अधिक जटिल targets को सीखने की रणनीति
-
गैर-लाभकारी ढाँचे की सीमाएँ और for-profit entity
- 2017 में OpenAI ने यह गणना शुरू की कि वास्तव में AGI बनाने के लिए किन शर्तों और कितनी compute scale की ज़रूरत होगी, और निष्कर्ष यह निकला कि बहुत बड़े कंप्यूटरों की आवश्यकता होगी
- OpenAI का मानना था कि Cerebras जो अनोखा computing hardware बना रही थी, वह गणना के हिसाब से ज़रूरी स्तर से भी बहुत आगे जा सकती है, और exclusive access या बड़े data center हासिल करना AGI निर्माण में बड़ा advantage दे सकता है
- उनका मानना था कि गैर-लाभकारी fundraising की एक सीमा होती है, और Elon Musk, Sam Altman, Ilya Sutskever, Greg Brockman इस बात पर सहमत हुए कि OpenAI के मिशन को पूरा करने का एकमात्र रास्ता OpenAI से जुड़ी for-profit entity बनाना है
- AGI बनाने के लिए capital चाहिए, लेकिन सिर्फ़ गैर-लाभकारी ढाँचे के सहारे 100 million dollar या 500 million dollar तक पहुँचना संभव हो सकता है, जबकि 1 billion dollar जुटाना बहुत कठिन माना गया
-
आंतरिक तनाव और Sam Altman को हटाए जाने की घटना
- ऐसे संगठन में जो मानता हो कि मानव-स्तर की बुद्धिमत्ता वाली मशीनें बनाई जा सकती हैं, वहाँ decision-makers, decision-making में शामिल values, और credit allocation जैसी सामान्य corporate politics भी अस्तित्वगत गंभीरता ले लेती है
- Brockman ने एक video call में देखा कि Sam को छोड़कर board के सदस्य मौजूद हैं, और उन्हें बताया गया कि board ने Sam Altman को हटाने का फैसला कर लिया है
- Brockman ने अतिरिक्त जानकारी माँगी, लेकिन जवाब मिला कि साझा करने के लिए और कुछ नहीं है; साथ ही यह भी बताया गया कि उन्हें भी board से हटाया जा रहा है, लेकिन कंपनी में बने रहना मिशन के लिए महत्वपूर्ण है
- कारण या feedback न मिलने पर Brockman ने call के तुरंत बाद अपनी पत्नी से बात की और निष्कर्ष निकाला कि उन्हें इस्तीफ़ा दे देना चाहिए
- इस्तीफ़े वाले दिन Sam और Brockman को यह संदेशों की बाढ़ मिली कि वे आगे जो भी करें, लोग साथ होंगे, और उनके करीबी सहयोगियों ने भी उसी दिन इस्तीफ़ा दे दिया
- Sam समेत पाँच लोगों ने नई कंपनी की कल्पना पर काम शुरू किया, और Brockman ने कंपनी वापस पाने की संभावना को 10% माना
- रविवार रात जब board ने interim CEO Mira को हटाकर किसी नए व्यक्ति को लाने की कोशिश की, तो कंपनी के भीतर विरोध भड़क उठा, और जो योजना शुरू में एक छोटे “lifeboat” की तरह सिर्फ़ कुछ संभावित साथियों को लेने की थी, वह लगभग सभी को शामिल करने की स्थिति तक बढ़ गई
- Thanksgiving से ठीक पहले भी कई कर्मचारियों ने घर लौटने वाली flights रद्द कर दीं और office में इकट्ठा हुए; petition document पर इतने लोग एक साथ sign करने लगे कि Google Docs अटक गया
- Brockman ने तड़के Twitter देखा और Ilya की वह पोस्ट देखकर बहुत राहत महसूस की, जिसमें उन्होंने petition पर sign करते हुए कहा था कि वह चाहते हैं कि कंपनी फिर से एकजुट हो जाए
-
Ilya Sutskever के साथ रिश्ते की बहाली और leadership से मिले सबक
- Ilya और Brockman का रिश्ता इतना क़रीबी था कि Ilya ने Brockman की civil marriage ceremony भी officiate की थी, और दोनों ने कठिन समय साथ झेला था
- बाद में दोनों ने उन बातों को समझने और व्यक्त करने में बहुत समय बिताया जो जमा हो गई थीं या कभी कही नहीं गई थीं, और Brockman को लगा कि इस प्रक्रिया ने उन्हें एक तरह की closure दी
- इस घटना के बाद competitors लोगों को अपनी तरफ़ खींचना चाहते थे, और शायद अधिक पैसे या बेहतर offers भी थे, लेकिन उस पूरे वीकेंड के दौरान OpenAI ने एक भी व्यक्ति नहीं खोया, और किसी ने भी rival offer स्वीकार नहीं किया
- जब Ilya गए, तब OpenAI के इतिहास में शायद वही लगभग एकमात्र पल था जब Brockman को लगा कि वह अब यह काम नहीं करना चाहते; उन्हें फिर से यह खोजना पड़ा कि यह काम क्यों महत्वपूर्ण है और इस दर्द को सहना क्यों सार्थक है
- break के दौरान उन्होंने DNA sequences पर language model train किया, और अपनी पत्नी के साथ मिलकर यह सोचने लगे कि AI जानवरों की health problems में क्या कर सकता है, यानी तकनीक को ऐसे क्षेत्र में लागू करना जो उनके लिए व्यक्तिगत रूप से अर्थपूर्ण हो
- पीछे मुड़कर देखने पर Brockman को लगा कि उनकी ज़्यादातर गलतियाँ ऐसी थीं जहाँ उन्हें पता था कि क्या करना चाहिए, लेकिन उन्होंने उस फैसले में बहुत देर कर दी; बार-बार सीखा गया सबक यही था: कठिन फैसले लो और कठिन बातचीत करो
तकनीकी टर्निंग पॉइंट और AI विकास की रफ्तार
-
लगातार आते वे पल जब लगा, “यह सच में काम कर रहा है”
- OpenAI की प्रगति कोई एक बार की समझ नहीं थी, बल्कि ऐसे लगातार आने वाले पलों की प्रक्रिया थी जब लगा, “यह सच में काम कर रहा है”
- शुरुआती लॉन्च वह क्षण था जब टीम को इकट्ठा कर मिशन को आगे बढ़ाना संभव हुआ, लेकिन अगले दिन ऑफिस में क्या करना है यह भी स्पष्ट नहीं था, यहां तक कि whiteboard भी नहीं था
-
Dota और PPO ने जो scalability दिखाई
- Dota पहली बड़ी उपलब्धि थी और इसने दिखाया कि compute बढ़ाने पर नतीजे भी बढ़ते हैं
- मूल Dota प्रोजेक्ट इस धारणा से शुरू हुआ था कि मौजूदा reinforcement learning scale नहीं करेगी, इसलिए नई विधि विकसित करने की कोशिश की गई थी, और इस्तेमाल किया गया algorithm PPO था
- PPO सभी time steps की योजना बनाता है और इसमें hierarchy नहीं होती, इसलिए यह इंसानों के दिन की योजना बनाने के तरीके से अलग है; इसे खामियों से भरा और scale न होने वाला माना गया, लेकिन baseline को उसकी सीमा तक धकेलने का फैसला किया गया
- PPO को लगातार scale करने के परिणामस्वरूप यह सर्वश्रेष्ठ मानव खिलाड़ियों के प्रदर्शन से आगे निकल गया, और इससे यह खोज हुई कि सरल algorithm और बड़े पैमाने का compute वास्तविक दुनिया में भी काम करता है
- Dota का environment ऐसा जटिल माहौल था जिसमें programming करना, आगे का अनुमान लगाना या search करना कठिन था, और इसमें लगभग इंसानी intuition की जरूरत थी
- इस्तेमाल किया गया neural network synapses की संख्या के लिहाज से “छोटे कीट के दिमाग” के ज्यादा करीब था, और इससे यह सवाल बचा कि अगर इसी compute approach को मानव मस्तिष्क के पैमाने के ज्यादा करीब ले जाया जाए तो क्या होगा
-
language model, semantic learning, और GPT-4 के बाद बदला मानदंड
- 2017 का unsupervised sentiment neuron पेपर उस पहले क्षण के रूप में देखा जाता है जब language modeling objective से semantics उभरते हुए दिखे
- केवल अगले अक्षर की भविष्यवाणी करने के लिए train करने पर भी neural network ने वाक्य का positive या negative भाव समझना सीख लिया, और इसने दिखाया कि यह comma, noun, verb की position ही नहीं, बल्कि वाक्य का अर्थ भी सीख सकता है
- GPT-4 पर काम करते समय यह सवाल उठा, “यह AGI क्यों नहीं है,” और वह मनचाहे विषय पर धाराप्रवाह बातचीत कर सकता था, लेकिन फिर भी साफ था कि कुछ कमी बाकी है
- GPT-4 के सार्वजनिक रिलीज़ से 2 महीने पहले जो AGI मानदंड मौजूद थे, संभव है वे GPT-4 की वास्तविक क्षमताओं से मेल नहीं खाते थे, और यह भी माना गया कि आगे भी अगले चरण की ओर ले जाने वाले breakthrough moments बाकी हैं
-
prediction, unsupervised learning, और reinforcement learning का जुड़ाव
- अगले शब्द की भविष्यवाणी करना साधारण लग सकता है, लेकिन यह दृष्टिकोण सामने आता है कि अगर Einstein की अगली बात सचमुच predict की जा सके, तो वह कम से कम Einstein जितना बुद्धिमान होगा
- prediction का सार पहले से ज्ञात चीज़ को सही ठहराना नहीं, बल्कि ऐसी नई परिस्थिति में, जिसे पहले कभी न देखा गया हो, यह अनुमान लगाना है कि आगे क्या आएगा
- model training को unsupervised learning में बांटा जाता है, जहां static और observational data से आगे आने वाली चीज़ की prediction करना सिखाया जाता है, और reinforcement learning में, जहां AI खुद action चुनता है, दुनिया से observations लेता है, और अपने ही data से सीखता है
- दोनों चरणों में इस्तेमाल होने वाली तकनीक मूल रूप से एक जैसी है; जो बदलता है वह है data structure
-
वह चरण जहां AI, AI development को तेज कर रहा है
- माना जाता है कि AI को उसके अपने development process में लागू करने के साथ अब हम ऐसे चरण में प्रवेश कर चुके हैं जहां विकास की रफ्तार लगातार तेज हो रही है
- ChatGPT के बाद internal development process 10~20% तेज हुआ, और हाल के coding tools ने software engineering के तरीके को काफी बदल दिया है
- model production में अधिकांश bottlenecks software में हैं, जैसे system implementation, scale-up, और बड़े computers का management
- माना जाता है कि जल्द ही AI उस चरण तक पहुंच जाएगा जहां वह अपने research ideas खुद देगा, experiments चलाएगा, और testing करेगा
- अभी code writing में AI द्वारा न लिखे गए हिस्से का अनुपात बताना कठिन है और वह “लगभग गायब होने के स्तर” पर है; सही context और structure दिए जाने पर वास्तविक code writing में AI इंसानों से बेहतर माना जाता है
- हालांकि module placement, components के बीच संबंध, और specific interfaces की definition जैसी code structure design में मानव विशेषज्ञ अब भी काफी बेहतर माने जाते हैं
-
नए ideas और chain of thought को सार्वजनिक न करने की नीति
- माना जाता है कि AI उस चरण के करीब पहुंच रहा है जहां वह ऐसे नए ideas दे सकेगा जिनके बारे में इंसानों ने नहीं सोचा
- 2024 में अपने chip design में circuit area कम करने के लिए OpenAI तकनीक लागू की गई, और model द्वारा बनाई गई optimization इंसानी सूची में पहले से मौजूद थी, लेकिन उसने उन कामों को ज्यादा तेज़ी से लागू किया जिन्हें समय की कमी के कारण किया नहीं गया था
- गणित और भौतिकी में खुली गणितीय समस्याओं और खुली भौतिकी समस्याओं पर काम किया जा रहा है, और कहा गया कि हाल ही में quantum physics की एक विशेष समस्या को community की अपेक्षा के उलट दिशा में हल किया गया और एक सुंदर formula भी सामने आया
- OpenAI distillation को कठिन बनाने की कोशिश करता है, और खास तौर पर chain of thought जैसे उन तत्वों की रक्षा करता है जो model का हिस्सा हैं लेकिन उपयोगकर्ता को परिणाम देने के लिए अनिवार्य नहीं हैं
- OpenAI की मुख्य बढ़त किसी एक खास model में नहीं, बल्कि model बनाने वाली machine में है
- reasoning न दिखाने के कारणों में एक distillation को रोकना है, और उससे भी अधिक महत्वपूर्ण कारणों में एक interpretability है
- अगर chain of thought को अच्छा दिखने के लिए train किया जाए, तो उसकी fidelity खत्म हो जाती है, और model अपने वास्तविक कारणों के बजाय उपयोगकर्ता की अपेक्षित शक्ल का reasoning बना सकता है
- OpenAI ने शुरुआती दौर में ही यह फैसला किया कि chain of thought को उपयोगकर्ता को दिखाने के लिए आकर्षक रूप में train करने के प्रलोभन से बचा जाए, और competition व safety कारणों से intermediate thinking को सार्वजनिक न करने की ओर झुकाव रहा
Compute की सीमाएँ, data center, product focus
-
वह दुनिया जहाँ compute मुख्य बाधा बन जाता है
- आगे चलकर कुल मिलाकर दुनिया compute-constrained world की ओर जा रही है
- model जो value बनाते हैं, वह सिर्फ साधारण question-answering से आगे बढ़कर health information तक access, कई data sources का integration, enterprise knowledge base search, कठिन समस्याओं का समाधान, और इंसानों से बेहतर software लिखने तक फैल रही है
- GPT-5 से 5.1, 5.2 Codex, 5.3 Codex, 5.4 तक की प्रगति बहुत बड़ी रही, और user intent समझने तथा goals के मुताबिक खुद को align करने की model की क्षमता में काफ़ी सुधार हुआ है
- Codex जैसी surface पर model को रखने से developers पहले की तुलना में कहीं अधिक हासिल कर सकते हैं
- अगर दुनिया के हर व्यक्ति को सिर्फ एक-एक GPU देना हो, तब भी 8 अरब GPU चाहिए होंगे, लेकिन मौजूदा trajectory उस स्तर के करीब भी नहीं पहुँच रही
- आज के समय में कई लाख GPU भी बड़े scale माने जाते हैं, और आगे चलकर लाखों GPU आ सकते हैं, लेकिन दुनिया में अभी भी compute बहुत कम है और इस technology को सब तक पहुँचाने के लिए इससे कहीं ज़्यादा चाहिए
-
Data center strategy और physical infrastructure
- OpenAI ने आगे आने वाली ज़रूरतों का अनुमान लगाकर compute बनाने में बहुत मेहनत की है, और वह models को सबके लिए व्यापक रूप से उपलब्ध कराने के mission पर ध्यान केंद्रित करना चाहता है
- data center पर बहुत मेहनत और पैसा लगाने की strategy का competitors ने मज़ाक उड़ाया था, लेकिन अब यह सिर्फ business में ही नहीं बल्कि technology को सब तक पहुँचाने वाले mission को पूरा करने में भी बढ़त बन सकती है
- AI के लिए data center “मानवता द्वारा बनाई गई सबसे बड़ी machine” के क़रीब हैं, और उनका उद्देश्य cancer treatment, business operations, और रोज़मर्रा के queries जैसी लोगों के लिए महत्वपूर्ण समस्याओं को हल करना और उन्हें goals हासिल करने में मदद देना है
- किसी specific problem के लिए dedicated data center को लेकर, उदाहरण के लिए Dakota का एक विशाल data center जो सिर्फ cancer solving के लिए काम करे, ऐसा इस साल ही हो जाए इसे भी नकारा नहीं जा सकता
- मौजूदा data center बहुत नाज़ुक बड़े machines हैं, और पहले ऐसे मामले भी हुए हैं जहाँ cables बहुत ज़्यादा तनी होने की वजह से signal integrity problems पैदा हुईं और computers चल ही नहीं पाए
- अभी system maintenance लोग physical रूप से करते हैं, लेकिन आगे चलकर यह robotics की ओर जा सकता है
- space data center में तकनीकी समस्याएँ बहुत हैं, लेकिन compute demand इतनी बड़ी है कि हर विकल्प के बारे में सोचना पड़ेगा
-
Compute allocation और accessibility
- जब compute सीमित हो, तब “image generation” और “cancer solving” जैसी अलग-अलग demands के बीच compute कहाँ allocate किया जाए यह सामाजिक रूप से महत्वपूर्ण सवाल बन जाता है
- OpenAI का मानना है कि compute तक सबकी पहुँच होनी चाहिए, और ChatGPT में free tier रखने का कारण भी यही है कि technology का व्यापक उपयोग हो, लोग उसे सीधे समझें, और उसके इस्तेमाल के तरीके खुद गढ़ें
- “ivory tower” शैली में पहले समस्याएँ हल करके बाद में results deploy करने वाले approach के भी फायदे हैं, लेकिन OpenAI का झुकाव technology के लाभों को व्यापक रूप से वितरित करने की दिशा में है
-
Enterprise और consumer का मेल
- OpenAI के अगले चरण में enterprise बहुत महत्वपूर्ण है, और अर्थव्यवस्था हमारी आँखों के सामने compute-based economy में बदल रही है
- software engineering में बदलाव पहले ही दिख चुका है, और computer के साथ काम करने वाले हर क्षेत्र में यह “इंसान computer के साथ काम करता है” वाले तरीके से हटकर computer इंसान के लिए काम करता है वाले तरीके की ओर जाएगा
- enterprise और consumer के बीच की सीमा धुंधली हो सकती है, और startup शुरू करना बहुत आसान हो जाने वाला बदलाव पहले ही दिखाई दे रहा है
- एक दोस्त ने अपनी छोटी बहन की मनचाही app की बात सुनते-सुनते उसे Codex में डाल दिया, और कुछ घंटों बाद जब उसने app दिखाया तो बहन ने पूछा, “इसे किसने बनाया?”, जिस पर उसने जवाब दिया, “तुमने बनाया”
- Codex को सिर्फ software engineers के लिए tool नहीं, बल्कि ऐसा tool बताया गया है जो vision और execution की इच्छा रखने वाले किसी भी व्यक्ति को builder बना सकता है
-
Personal AI और एक unified technology system
- OpenAI जिस consumer क्षेत्र पर विशेष ध्यान दे रहा है, वह entertainment या self-expression से ज़्यादा goals को solve करना है
- अगर smartphone users लगभग 4 अरब हैं, तो हर किसी के पास ऐसा personal AI या personal AGI होना चाहिए जो उन्हें अच्छी तरह जानता हो, उनके personal context को समझता हो, भरोसेमंद हो, और जिससे सलाह ली जा सके
- personal AI proactively काम कर सकता है, जैसे पसंदीदा musician शहर में आए तो ticket खरीद लेना; कुछ मामलों में वह पहले पुष्टि कर सकता है और कुछ में pre-approval के आधार पर सीधे execute कर सकता है
- लेकिन goals अब भी user को ही तय करने चाहिए, और user के पास control होना चाहिए — यह एक बुनियादी शर्त है
- personal AI या personal AGI तक पहुँच रखने वालों की संख्या 4 अरब से आगे बढ़कर 8 अरब, यानी पूरी पृथ्वी की आबादी होनी चाहिए
- चाहे इसका उपयोग काम में हो या personal life में, कई instances हो सकते हैं, लेकिन मूल रूप से इसे एक ही technology system के रूप में देखा जाता है
डिप्लॉयमेंट, सुरक्षा, तटस्थता, रेगुलेशन
-
क्रमिक डिप्लॉयमेंट
- क्रमिक डिप्लॉयमेंट(iterative deployment) उन मुख्य स्तंभों में से एक है जिनका उपयोग OpenAI ने तकनीक को लोगों के लिए लाभकारी बनाने और अपने मिशन को पूरा करने के लिए किया है
- AGI को गुप्त रूप से बनाकर कुछ भी डिप्लॉय न करना और फिर किसी क्षण बटन दबाकर उसे जारी करने का रास्ता भी हो सकता है, लेकिन उस स्थिति में शक्तिशाली सिस्टम और वास्तविक दुनिया के बीच पहली टक्कर को एक ही बार में संभालना पड़ेगा
- इसके उलट, अगर धीरे-धीरे अधिक शक्तिशाली होते सिस्टम को कई बार डिप्लॉय किया जाए, तो स्थिति “100वें सिस्टम” को संभालने जैसी हो जाती है, और पहले की 99 समस्याओं के समाधान से सीखा जा सकता है, साथ ही दुनिया को भी अनुकूलन का समय मिलता है
- GPT-3 को डिप्लॉय करने से पहले गलत सूचना जैसी बड़ी तस्वीर पर बहुत सोचा गया था, लेकिन वास्तविकता में सबसे बड़ा दुरुपयोग लोगों को कई दवाओं का विज्ञापन करने वाला medical spam निकला
- क्रमिक डिप्लॉयमेंट का मतलब है कि बीच के versions दुनिया के सामने लाकर वास्तविक दुरुपयोग और जोखिमों को देखा और उनसे सीखा जाए; इसका अर्थ यह नहीं है कि बिना सोचे-समझे सब कुछ डिप्लॉय कर दिया जाए
- AI जैसी तेज़ी से डिप्लॉय होने वाली और शक्तिशाली तकनीक के लिए कोई playbook नहीं है, और OpenAI भी उसे बनाते हुए सीखने की स्थिति में है
-
सुरक्षा एक product feature है
- सुरक्षा केवल कोई अतिरिक्त चीज़ नहीं, बल्कि मुख्य product feature है, और कोई भी ऐसा model नहीं चाहता जो उसके साथ aligned न हो
- उपयोगकर्ता ऐसा model चाहते हैं जिस पर हर स्थिति में भरोसा किया जा सके और जो सही काम करे
- OpenAI का मानना है कि उसने सुरक्षा में लोगों की धारणा से कहीं अधिक, और शायद किसी भी अन्य lab से अधिक निवेश किया है
- ChatGPT दुनिया में सबसे अधिक लोगों द्वारा उपयोग किए जाने वाले language model deployments में से एक है, इसलिए OpenAI को सुरक्षा पर ध्यान देना ही पड़ता है, और उसका कहना है कि वह हमेशा से ऐसा करता आया है
- उनका मानना है कि सफल products बनाने वाले AI developers के लिए सुरक्षा में बहुत मज़बूती से निवेश किए बिना कोई टिकाऊ स्थिति संभव नहीं है
-
सामाजिक resilience और OpenAI Foundation
- सुरक्षा केवल model तक सीमित नहीं है, यह इस बात से भी जुड़ी है कि समाज resilience कैसे बनाता है
- कारों के लिए seatbelt और सड़कें चाहिए, और बिजली के लिए safety standards तथा बिजली के खंभों और high-voltage lines की व्यवस्था जैसे नियम होते हैं
- AI में भी केवल model ही नहीं, बल्कि यह भी महत्वपूर्ण है कि वह दुनिया में कैसे integrate होता है और समाज resilience कैसे बनाता है
- OpenAI Foundation का एक मुख्य फोकस यह है कि वह AI के लिए एक resilient layer में समाज को निवेश और निर्माण करने में मदद करे
-
model की राजनीतिक bias, तटस्थता, और user preference learning
- OpenAI का कहना है कि वह models को तटस्थ और सत्य का प्रतिनिधि बनाने के लिए बहुत प्रयास करता है, और model में डाले गए values तथा उसके व्यवहार का तरीका वेबसाइट पर उपलब्ध public spec में देखा जा सकता है, जहाँ feedback भी दिया जा सकता है
- Twitter screenshots हमेशा पूरी तरह ईमानदार नहीं हो सकते, क्योंकि पीछे की memory, छिपे हुए निर्देश, या पिछली बातचीत के context की वजह से जवाब किसी खास दिशा में मोड़ा गया हो सकता है
- कुछ सवालों का कोई सही उत्तर नहीं होता, और अगर एक शब्द में जवाब देने को कहा जाए तो किसी भी उत्तर पर bias का आरोप लग सकता है
- OpenAI के लिए महत्वपूर्ण मूल बात सत्य और उपयोगकर्ता का प्रतिनिधित्व करने वाला AI है
- उपयोगकर्ता की पसंद के अनुरूप model को train करने का तरीका समय के साथ विकसित हुआ है, और एक समय ऐसा भी था जब model इस दिशा में झुक गया था कि वह उपयोगकर्ता को वही कहे जो वह सुनना चाहता है
- लक्ष्य यह है कि model उपयोगकर्ता के दीर्घकालिक लक्ष्यों और दीर्घकालिक भलाई में मदद करे, और अल्पकालिक संतुष्टि के लिए “grader hacking” न होने पाए, इसके लिए तकनीकी सुधार किए गए हैं
-
रेगुलेशन, डेटा सेंटर चिंताएँ, और राष्ट्रीय रणनीति
- AI रेगुलेशन को यह सुनिश्चित करना चाहिए कि तकनीक अंततः लोगों के लिए लाभकारी हो, और उसे इस तथ्य से भी निपटना होगा कि जो संस्थाएँ, नौकरियाँ, और जीवन-पथ पहले स्थिर माने जाते थे, वे अब स्थिर न रह जाएँ
- क्या सभी को compute तक पहुँच मिलनी चाहिए, और जब तकनीक अधिक आर्थिक मूल्य पैदा करे तो उस मूल्य को एक ही जगह जमा होने से कैसे रोका जाए—ये रेगुलेशन के मुख्य प्रश्न हैं
- कुछ लोग कहते हैं कि ChatGPT के उपयोग से उनकी या उनके किसी प्रियजन की जान बची, और ऐसे उपयोगों को समर्थन और सुरक्षा मिलनी चाहिए
- डॉक्टर या वकील के साथ बातचीत कानूनी रूप से संरक्षित privileged communication होती है, लेकिन AI के लिए ऐसा ढाँचा अभी मौजूद नहीं है
- इस बात की चिंता है कि data centers बिजली के बिल बढ़ा सकते हैं, और OpenAI का कहना है कि उसके पास ऐसा न होने देने की प्रतिबद्धता है
- data centers के पानी के उपयोग को लेकर बहुत बातें होती हैं, लेकिन OpenAI का कहना है कि उसके data centers बहुत कम पानी इस्तेमाल करते हैं, और यह कहना कि वे बहुत अधिक पानी इस्तेमाल करते हैं, गलत जानकारी है
- पानी का उपयोग कम होने का कारण यह है कि वे closed-loop structure पर चलते हैं, यानी एक स्विमिंग पूल जितना पानी भरकर उसे लगातार circulate किया जाता है
- मौजूदा स्थिति “global AI race” से अधिक global AI renaissance के करीब है, और देशों के बीच की dynamics अभी पूरी तरह तय नहीं हुई है
- उनका मानना है कि AI में अमेरिका का नेतृत्व करना इस बात के लिए महत्वपूर्ण है कि लोकतांत्रिक values सुरक्षित और संरक्षित रहें
- अलग-अलग देश यह समझ रहे हैं कि अगर AI economic security और national security की बुनियाद बन रहा है, तो उन्हें किसी न किसी रूप में इसमें भाग लेना होगा, और sovereign AI strategy की ज़रूरत है
- अगर chip exports और technology exports पर बहुत सख्त रोक लगाई जाए, तो दूसरे देश अपने प्रतिस्पर्धी खुद बना सकते हैं या दूसरे providers पर निर्भर हो सकते हैं; और अगर नियम बहुत ढीले हों, तो अमेरिका अपनी बढ़त खो सकता है
- leadership का मतलब केवल आगे होना नहीं, बल्कि दुनिया को साथ लेकर आगे बढ़ना भी है
नौकरियां, ज़रूरी क्षमताएं, और वांछनीय भविष्य
-
नौकरी की असुरक्षा और क्या हासिल होगा
- AI ठीक-ठीक कैसे आगे बढ़ेगा, यह अनिश्चित है और यह चौंकाने वाले तरीकों से सामने आ सकता है; मौजूदा AI और दुनिया भी science fiction में कल्पना की गई तस्वीर से अलग हैं
- यह नकारा नहीं जा सकता कि बदलाव आ रहा है, और जो खोया जाएगा उसे देखना आसान है, लेकिन क्या हासिल होगा इसे पहले से देख पाना कहीं अधिक कठिन है
- अगर 1950 के किसी व्यक्ति को समझाया जाए कि कंप्यूटर, मोबाइल फोन और GPS के बाद 3 मिनट के भीतर अपनी मौजूदा लोकेशन पर कार बुलाना संभव होगा, तो यह अजीब लगेगा, लेकिन वास्तव में ऐसे तकनीकी निवेश हजारों, लाखों और करोड़ों उपयोगों तक पहुंचे
- AI का मूल क्षमता-वृद्धि और इंसानी agency में है, और कुछ संस्थाएं व पेशे जितने स्थिर दिखते हैं, उतने नहीं हो सकते; इसका लोगों पर असर पड़ेगा
- AI तकनीक की कई पीढ़ियों को देखते हुए, पहले की पीढ़ी की तकनीक पहले सीखने वाले लोग अगली पीढ़ी में भी सबसे बड़ा लाभ पाने की प्रवृत्ति रखते थे
- मुख्य क्षमताएं हैं agency, vision और ideas, और कुछ आज़माकर देखने की entry barrier पहले से कहीं कम हो गई है
- दुनिया को यह सोचना होगा कि अनिश्चितता और संक्रमण से गुजर रहे सभी लोगों को कैसे सहारा दिया जाए, और अर्थव्यवस्था compute-आधारित अर्थव्यवस्था में बदल जाएगी
-
युवा पीढ़ी को क्या सीखना चाहिए
- हाई स्कूल, कॉलेज और शुरुआती करियर चरण के लोगों के लिए महत्वपूर्ण क्षमता है AI का गहराई से उपयोग करना और AI से अधिकतम निकालने का तरीका समझना
- आगे चलकर दुनिया ऐसी हो सकती है जहां हर कोई agents का manager, और उससे भी आगे स्वायत्त AI कंपनी का CEO बन जाए
- ऐसी स्थिति की कल्पना की जा सकती है जहां 1 लाख कर्मचारियों वाली कंपनी की पूरी श्रमशक्ति 24 घंटे आपके लिए काम कर रही हो; इसके लिए tokens और compute की ज़रूरत होगी
- हर किसी की compute तक पहुंच सुनिश्चित करना एक केंद्रीय समस्या है, जिसे दुनिया को सही ढंग से हल करना होगा
- आगे महत्वपूर्ण क्षमताएं होंगी: AI का उपयोग करना, तकनीकों को नए तरीके से जोड़ना, agents के साथ interact करना और उन्हें manage करना, और यह समझना कि आप क्या चाहते हैं और आपका उद्देश्य क्या है
-
जोखिम और वांछनीय भविष्य
- अब तक तकनीक का बड़ा हिस्सा ऐसा रहा है जिसमें इंसान अपने शरीर और जीवन को मशीन के हिसाब से मोड़ता रहा है; किसी डिब्बेनुमा स्क्रीन के सामने टाइप करते हुए carpal tunnel syndrome और झुके हुए कंधे झेलना इंसानों के लिए स्वाभाविक नहीं है
- आगे हम उस दुनिया की ओर बढ़ेंगे जहां इंसान कंप्यूटर के लिए काम नहीं करेगा, बल्कि कंप्यूटर इंसान के लिए काम करेगा, और इससे अवसर भी बनेंगे और जोखिम भी
- अगर मशीनें इंसानी लक्ष्यों को पूरा करने में मदद करेंगी, तो यह तय करना होगा कि आपस में टकराने वाले लक्ष्यों का समन्वय कैसे किया जाए, और AI किस चीज़ में मदद करेगा और किसमें नहीं, इसकी सीमाएं कैसे तय हों
- यह खोजना होगा कि AI समाज में कैसे दाखिल हो, और उसके लाभ किसी एक कंपनी या एक समूह तक सीमित न रहकर सबको ऊपर उठाएं
- हमें न्यूनतम स्तर को ऊपर उठाना होगा ताकि हर व्यक्ति को एक अच्छी ज़िंदगी, इस तकनीक तक पहुंच, और इससे कुछ करने की क्षमता मिल सके; तब उसके साथ ऊपरी सीमा भी उठेगी
- healthcare access के मामले में ऐसी दुनिया संभव है जहां हर व्यक्ति की जेब में आज के किसी भी डॉक्टरों की टीम से बेहतर डॉक्टर हो
- यह बदलाव विघटनकारी है और मुफ्त में नहीं आएगा, और शुरुआती गलतियां पहले ही सामने आ चुकी हैं
- आने वाले 2 साल में यह अच्छे के लिए एक ताकत बन सकता है, लेकिन इस उभरती संभावना को हासिल करने के लिए यह भी स्वीकार करना होगा कि चीजें किन-किन तरीकों से गलत जा सकती हैं और क्या जोखिम हैं
-
व्यक्तिगत मानदंड और सफलता की परिभाषा
- सिर्फ paper लिखना, citations पाना और conferences में ध्यान खींचना mission पूरा करने के लिए पर्याप्त नहीं है; यह जुड़ना चाहिए इस सवाल से कि “वह काम कैसे AGI को दुनिया के लिए बेहतर दिशा में ले जाता है”
- Ilya के शब्दों में, एक नज़रिया यह है कि “दर्द से गुजरना चाहिए”; अगर दर्द नहीं है, तो लगभग इसका मतलब है कि आप कोई मूल्य नहीं बना रहे
- OpenAI का तरीका समस्याओं को ढककर अंधाधुंध आगे बढ़ना नहीं था, बल्कि कठिन सच का सामना करना और वास्तविकता को जैसी है वैसा समझना था
- गैर-तकनीकी लोगों तक AI का जो अर्थ पहुंचाना चाहिए, वह यह है कि यह व्यक्तिगत जीवन में मदद करेगा, science और medicine को आगे बढ़ाएगा, और सबको ऊपर उठाने वाली अच्छी ताकत बन सकता है
- सफलता का मतलब है OpenAI का mission: यह सुनिश्चित करना कि artificial general intelligence पूरी मानवता के लिए लाभकारी हो
1 टिप्पणियां
Hacker News की राय
मुझे वह समय याद है जब पुराने computer magazines programmers के लिए होते थे और उनमें code listings भी छपती थीं
फिर किसी बिंदु पर वे सिर्फ IBM बनाम Microsoft मुकदमे की बातें करने लगे, और उसके बाद ऐसे बदल गए मानो उन्हें computer companies की अंदरूनी राजनीति पर ही बोलते रहने का फ़ॉर्मूला मिल गया हो। इस तरह की company-versus-company coverage उबाऊ है, और tech दुनिया के reality TV जैसी लगती है। जैसे आज रात Debra बाहर होगी या Deborah, बस उसी तरह
दुनिया की नज़र में यह असली tech से ज़्यादा उस पागलपन भरे पैसे, ताकत, प्रभाव और साज़िशों के बारे में है जिन्हें tech ने संभव बनाया। IBM बनाम Microsoft के समय भी इसका पैमाना बड़ा था, लेकिन आज OpenAI के दौर का पैमाना कल्पना से परे है। कुछ पीढ़ियाँ ऐसी भी रही हैं जिनका engineering/technology वाली दुनिया से रिश्ता सिर्फ इसी दूसरे पहलू में दिलचस्पी की वजह से बना। Byte magazine वाला दौर याद आता है
अगर पूरा सुनना नहीं चाहते, तो यहाँ देख सकते हैं: https://apecast.app/podcast/the-knowledge-project/episode/op...
Brockman अतीत को कैसे देखते थे, इसका अंदाज़ा Musk मुकदमे के दौरान सार्वजनिक हुई उनकी private diary से भी मिलता है
उदाहरण के लिए उसमें “Financially what will take me to $1B?” जैसी पंक्ति है। वैसे Musk यह मामला बहुत देर से लाए, इसलिए हार गए
समझ नहीं आता कोई Ilya के असली इरादे क्यों नहीं पूछता
पहले Sam को निकालना, फिर उस सामूहिक पत्र पर हस्ताक्षर करना जिसमें कहा गया कि अगर Sam बाहर रहे तो OpenAI छोड़ देंगे—यह क्रम समझ में नहीं आता। बाकी सारी जानकारी बहुत सतही लगती है
व्यवहार में इसे लागू करना शायद कहीं ज़्यादा मुश्किल होता, लेकिन हो सकता है इससे लोगों को यह अटल नतीजा लगा हो
पता नहीं क्यों, लेकिन यह episode काफ़ी boring लगा
शायद इसलिए कि इसमें लगभग कुछ भी ऐसा साझा नहीं किया गया जो unexpected हो या पहले से known न हो
मुझे नहीं लगता उस घटना से OpenAI खत्म हो जाता। बल्कि वह शायद ठीक हो जाता
दिलचस्प बात यह है कि जवाब उन्हें लगभग संयोग से मिला। pretraining बड़े पैमाने की unsupervised learning है, और RLHF reinforcement learning है। उन्हें बस अभी recipe नहीं पता थी
समझ नहीं आता कोई non-profit ऐसा कैसे कर सकता था
क्या इससे यह मिसाल नहीं बनती कि non-profit असल में किसी मायने में बंधन नहीं है? यानी पहले फ़ायदेमंद structure इस्तेमाल करो, और जब खुद अमीर बनने का समय आए तो उसे बदल दो
OpenAI की स्थापना 2015 में Delaware non-profit के रूप में हुई थी, और 2017 में scaling laws मिलने के बाद उन्हें समझ आया कि अनुमान से कहीं ज़्यादा compute और funding चाहिए होगी। इसके बाद ज़्यादा पूंजी जुटाने के लिए structure बदलने पर बातचीत हुई, और दूसरे founders ने Musk को control दिए बिना आगे बढ़ना चुना, जिसके बाद Musk चले गए। 2018 में Elon के योगदान बंद होने के बावजूद fundraising बहुत बढ़ाने की कोशिश हुई, लेकिन $100M के लक्ष्य में सिर्फ $50M ही जुट पाया। 2019 में commercial capital लाने के लिए capped-profit subsidiary बनाई गई, और non-profit ने एक independent appraiser रखकर intellectual property की value आंकी, फिर उसे लगभग $60M के fair value पर for-profit entity को transfer कर दिया। बदले में non-profit को यह अधिकार मिला कि profit आने पर मूल IP निवेश पर 100x तक, यानी $6B तक, राशि मिले; और भविष्य के investors अपनी caps तक पहुँच जाएँ उसके बाद बचा residual profit भी उसे मिले। Microsoft ने 2019 में $1B, 2021 में $2B, और 2023 में $10B निवेश किए, और हर निवेश पर 20x या 6x cap लगी, जिससे कुल target repayment $92B बना। 2025 में capped-profit structure से निकलकर इसे पारंपरिक equity वाले public benefit corporation में recapitalize किया गया, और non-profit ने residual profit rights तथा पुराने $60M transfer पर 100x profit cap छोड़ने के बदले for-profit entity में 26% equity ली, जिसकी मौजूदा value लगभग $200B है। यह विवरण Musk v. Altman रिकॉर्ड से आता है, और निष्कर्ष यह है कि non-profit ने 2019 में लगभग $60M की intellectual property को भविष्य के $6B लाभ-अधिकार में बदला, और recapitalization के बाद अब उसके पास $200B की equity है। इस thread में कई लोग मानते हैं कि non-profit अब मौजूद नहीं है, लेकिन यह सही नहीं है
प्रक्रिया के नज़रिए से कहूँ तो, इस समय सबसे महत्वपूर्ण AI company Anthropic है