OpenAI के CEO Sam Altman का Sora, ऊर्जा और AI साम्राज्य के निर्माण पर इंटरव्यू
(a16z.substack.com)- a16z पॉडकास्ट में OpenAI के विज़न को पर्सनल AI सब्सक्रिप्शन सर्विस, बड़े पैमाने का इन्फ्रास्ट्रक्चर, और AGI रिसर्च के एकीकरण के रूप में समझाया गया, और ज़ोर दिया गया कि ये तीनों तत्व वर्टिकली जुड़े हुए एक ही स्टैक का निर्माण करते हैं
- OpenAI का लक्ष्य एक पर्सनल AI सब्सक्रिप्शन सर्विस है, जो रिसर्च, इन्फ्रास्ट्रक्चर और कंज़्यूमर प्रोडक्ट्स को वर्टिकली इंटीग्रेट करके AGI डेवलपमेंट और वास्तविक उपयोग—दोनों को साथ लेकर चलती है
- Sora लॉन्च करने का रणनीतिक उद्देश्य सिर्फ़ एक वीडियो जनरेटर प्रोडक्ट लॉन्च करना नहीं है, बल्कि समाज को शक्तिशाली वीडियो मॉडलों के आगमन के लिए तैयार करना और world model डेवलपमेंट के ज़रिए AGI रिसर्च को आगे बढ़ाना है
- GPT-5 के माध्यम से AI scientist के युग का आगमन हो रहा है, और ऐसे शुरुआती उदाहरण सामने आ रहे हैं जहाँ मॉडल वास्तव में वैज्ञानिक खोज कर रहे हैं, इसलिए आने वाले 2 वर्षों में महत्वपूर्ण वैज्ञानिक खोजों की संभावना जताई गई
- ऊर्जा और AI के संगम, copyright पर fair use सिद्धांत की संभावित लागू क्षमता, और AGI के अपेक्षा से अधिक क्रमिक रूप से आने से समाज को अनुकूलन का समय मिलने जैसी आशावादी दृष्टि पेश की गई, साथ ही कहा गया कि AI द्वारा वैज्ञानिक प्रगति को तेज़ करने का युग पहले ही शुरू हो चुका है
OpenAI का विज़न और संरचना
- OpenAI तीन स्तंभों से बना है: कंज़्यूमर AI सब्सक्रिप्शन सर्विस, बड़े पैमाने का इन्फ्रास्ट्रक्चर, और रिसर्च लैब
- लक्ष्य ऐसा सब्सक्रिप्शन-आधारित सर्विस देना है जो पर्सनलाइज़्ड AI के ज़रिए यूज़र के context को समझे और एक सच्चे personal assistant की भूमिका निभाए
- अनुमान है कि ज़्यादातर लोगों के पास एक personal AI subscription होगा, और कुछ लोग कई subscriptions भी इस्तेमाल करेंगे
- यूज़र अलग-अलग services में लॉग इन करेंगे और समर्पित devices के माध्यम से AI का उपयोग करेंगे
- लक्ष्य यह है कि AI यूज़र को समझते-समझते बेहद उपयोगी बन जाए
- इन्फ्रास्ट्रक्चर AGI डेवलपमेंट और सर्विस डिलीवरी, दोनों को सपोर्ट करने के लिए अनिवार्य तत्व है
- फिलहाल इसे दूसरी कंपनियों को raw infrastructure के रूप में बेचने की कोई योजना नहीं है
- लेकिन पैमाना इतना विशाल है कि भविष्य में अन्य उपयोगों पर विचार करना पड़ सकता है
- मानव इतिहास का सबसे बड़ा data center, या अधिक सटीक रूप से, सबसे बड़ा infrastructure project बनाया जा रहा है
- शुरुआती दौर में वे vertical integration को लेकर सशंकित थे, लेकिन अब रुख बदलकर यह मानते हैं कि “vertical integration के बिना AGI को साकार नहीं किया जा सकता”
- यह बदलाव investor के नज़रिए से operator के नज़रिए तक पहुँचने जैसा था
- यह सिद्धांत कि अर्थव्यवस्था कुशल होती है और कंपनियाँ एक काम बहुत अच्छे से कर सकती हैं, OpenAI के मामले में लागू नहीं होता
- OpenAI की कहानी इस दिशा में बढ़ी कि मिशन पूरा करने के लिए अनुमान से कहीं ज़्यादा काम करना पड़ेगा
- iPhone को टेक इंडस्ट्री द्वारा बनाया गया सबसे अद्भुत प्रोडक्ट बताया गया, और इसे बेहद गहरे vertical integration का उदाहरण कहा गया
- ऐसी वर्टिकल स्टैक संरचना की ज़रूरत है जिसमें रिसर्च शानदार प्रोडक्ट्स बना सके और इन्फ्रास्ट्रक्चर रिसर्च को संभव बनाए
Sora लॉन्च करने का रणनीतिक उद्देश्य
- ऊपर से देखने पर Sora का AGI से सीधा संबंध नहीं लगता, लेकिन माना जाता है कि world model बनाना AGI के लिए महत्वपूर्ण होगा
- जैसे ChatGPT ने समाज को AGI के लिए तैयार किया, वैसे ही Sora समाज को AI-जनित वीडियो के वास्तविक प्रभावों के साथ अनुकूलन में मदद करता है
- वीडियो में टेक्स्ट की तुलना में भावनात्मक प्रतिध्वनि बहुत अधिक होती है, इसलिए समाज का इसे समझना महत्वपूर्ण है
- जल्द ही ऐसे शानदार video models आएँगे जो deepfake या मनचाही कोई भी चीज़ दिखा सकेंगे
- AI को सिर्फ़ efficient बनाना ही नहीं, बल्कि मज़ेदार और आनंददायक भी बनाना चाहिए
- कुल computing resources का बहुत बड़ा हिस्सा इसमें नहीं लगाया जाता, लेकिन absolute scale में यह फिर भी काफ़ी संसाधन लेता है
- नया Sora social networking features जोड़कर एक दिलचस्प दिशा में विकसित हो रहा है
- “समाज और तकनीक को साथ-साथ विकसित होना चाहिए” कहते हुए, AI आने से पहले प्रयोग और अनुकूलन की प्रक्रिया के महत्व पर ज़ोर दिया गया
AI scientist का उदय
- GPT-5 के माध्यम से ऐसे शुरुआती उदाहरण सामने आ रहे हैं जहाँ AI वैज्ञानिक खोज कर रहा है
- नई गणितीय खोजें, physics और biology research में छोटे-छोटे योगदान
- उम्मीद है कि अगले 2 वर्षों में मॉडल बड़े पैमाने पर science कर पाएँगे और महत्वपूर्ण खोजें करेंगे
- Sam Altman का मानना है कि Turing test जैसी किसी चीज़ का असली अर्थ AI की science करने की क्षमता है
- यह दुनिया में वास्तविक बदलाव लाएगा
- वैज्ञानिक प्रगति लंबे समय में दुनिया को बेहतर बनाने वाला सबसे महत्वपूर्ण तत्व है
- Turing test पहले ही पार किया जा चुका है, लेकिन दुनिया में कोई असंभव-सा भारी बदलाव नहीं आया
- AGI भी शायद इसी तरह आएगा, लेकिन singularity वास्तव में नहीं होगी, और बदलाव अपेक्षा से अधिक क्रमिक होगा
- उनका मानना है कि चाहे रिसर्च कितनी भी उग्र गति से हो, समाज उम्मीद से तेज़ी से सीख लेगा
- लोग और समाज हमारी सोच से कहीं अधिक अनुकूलनशील हैं
- वे AGI के आने की संभावना को स्वीकार करेंगे, उसे आत्मसात करेंगे, और संतुलन पा लेंगे
- यह प्रक्रिया अपेक्षा से कहीं अधिक सतत होगी
AI-human interface का विकास
- मॉडल पहले ही बुनियादी chatbot conversation के मामले में बहुत उच्च स्तर तक पहुँच चुके हैं
- लेकिन “मेरा कैंसर ठीक कर दो” जैसे अनुरोध अभी भी संभव नहीं हैं
- टेक्स्ट interface शैली में अभी भी काफी आगे विकास की गुंजाइश है
- यह आगे बढ़कर ऐसे संसार तक जाएगा जहाँ real-time rendered video ही interface बन जाएगा
- ऐसा ambient device जो आसपास के वातावरण को समझे और ज़रूरत पड़ने पर ही जानकारी दिखाए
- बेतरतीब text message notifications भेजने के बजाय context समझकर सही समय पर जानकारी देना
- लंबे समय में यह “ऐसा interface” बनेगा जहाँ AI यूज़र को समझकर पहले से तय करेगा कि किस तरह की personal conversation style अपनानी है
- यूज़र personalization का महत्व
- अरबों लोगों का एक ही brain से बात करना अजीब बात है
- हर यूज़र AI से अलग तरह का व्यवहार चाहता है
- ChatGPT यूज़र का इंटरव्यू लेकर उनकी preferences समझे और अपने-आप adjust हो—यह उसी दिशा में बढ़ रहा है
इन्फ्रास्ट्रक्चर, सहयोग और ऊर्जा
- OpenAI AMD·NVIDIA·Oracle आदि के साथ सहयोग करते हुए बड़े पैमाने पर इन्फ्रास्ट्रक्चर विस्तार कर रहा है
- चूँकि OpenAI के अस्तित्व का उद्देश्य AGI बनाना है, इसलिए रिसर्च को प्राथमिकता मिलती है और GPU को प्रोडक्ट्स से पहले रिसर्च के लिए आवंटित किया जाता है
- सिर्फ़ विशेष स्थितियों में, जैसे कोई नया फीचर viral हो जाए, अपवाद बनता है
- बड़े पैमाने की capacity बनाने का उद्देश्य यह है कि ऐसी कठिन और पीड़ादायक प्राथमिकता-निर्धारण वाली स्थितियाँ न बनें
- अच्छी research culture शुरुआती-stage investment firm चलाने जैसी होती है
- इसमें founders पर दांव लगाया जाता है और उन्हें support किया जाता है
- यह product company चलाने से अलग दृष्टिकोण है
- ऊर्जा के बारे में उन्होंने ज़ोर देकर कहा कि “प्रचुर और सस्ती ऊर्जा ही मानव जीवन की गुणवत्ता बढ़ाने की कुंजी है”
- अल्पकाल में natural gas, और दीर्घकाल में solar + storage तथा advanced nuclear (SMR·fusion) के मुख्यधारा बनने का अनुमान है
- nuclear regulation में ढील आवश्यक है, और कीमतें तेज़ी से गिरें तो बदलाव की गति भी बहुत तेज़ होगी
मॉडल क्षमताओं का मूल्यांकन
- स्थिर benchmark scores अपना आकर्षण खो रहे हैं और उन पर बहुत gaming हो रही है
- वैज्ञानिक खोजें लंबे समय तक उपयोगी रहने वाला evaluation metric बन सकती हैं
- revenue भी एक दिलचस्प evaluation metric माना जा रहा है
AI safety और regulation पर दृष्टिकोण
- सिर्फ़ इसलिए कि तकनीक ने अभी तक बहुत डरावने या विशाल जोखिम पैदा नहीं किए, यह नहीं मान लेना चाहिए कि आगे भी ऐसा ही रहेगा
- कुछ बेहद अजीब या डरावने क्षण आने की संभावना है
- पिछली तकनीकों की तरह, कुछ सचमुच बुरी घटनाएँ भी होंगी
- उन्होंने माना कि “AI technology अनिवार्य रूप से जोखिमपूर्ण क्षणों का सामना करेगी”, इसलिए सामाजिक safeguards बनाना ज़रूरी है
- ज़्यादातर regulation में कई कमियाँ होने की संभावना है, इसलिए उन्होंने सिर्फ़ अत्यधिक शक्तिशाली मॉडलों पर सीमित regulation का प्रस्ताव रखा
- जब कोई मॉडल वास्तव में बेहद superhuman capability हासिल कर ले, तभी ऐसे मॉडल—और सिर्फ़ ऐसे मॉडल—बहुत सावधानी से safety testing के योग्य होंगे
- उम्मीद है कि कम सक्षम मॉडलों से होने वाले तमाम अच्छे कामों पर regulatory burden न डाला जाए
- यूरोपीय शैली की पूर्ण सख्ती बहुत बुरी होगी
- क्योंकि चीन पर ऐसे प्रतिबंध नहीं होंगे, इसलिए अमेरिका का AI में पीछे रहना दुनिया के लिए बहुत ख़तरनाक होगा
- अत्यधिक regulation उलटे वैश्विक जोखिम को बढ़ा सकता है
copyright, open source और content का भविष्य
- training data के बारे में उन्होंने अनुमान जताया कि “learning को fair use” माना जाने की संभावना अधिक है
- लेकिन character, style और IP-आधारित content generation के लिए नए commercial models की ज़रूरत होगी
- जैसे एक मानव लेखक उपन्यास पढ़कर प्रेरणा ले सकता है, लेकिन उपन्यास की नकल नहीं कर सकता
- कुछ rights holders यह शिकायत भी करते हैं कि “मेरे character पर्याप्त बार नहीं दिखाई देते”, यानी content collaboration structure का पुनर्गठन जारी है
- open source model gpt-oss को सकारात्मक रूप से देखा गया, और चीनी मॉडलों के एकाधिकार-आधारित प्रसार को रोकने की आवश्यकता का भी उल्लेख किया गया
ऊर्जा और AI का संगम
- उनकी दो प्रमुख रुचियाँ, AI और ऊर्जा, अब एक ही दिशा में मिलती दिख रही हैं
- इतिहास देखें तो लोगों की जीवन-गुणवत्ता सुधारने में सबसे बड़ा योगदान सस्ती और प्रचुर ऊर्जा का रहा है
- इसलिए ऊर्जा को बहुत अधिक आगे बढ़ाना एक अच्छा विचार है
- अल्पकाल में natural gas के अमेरिका की net new base-load energy का अधिकांश हिस्सा बनने की संभावना है
- दीर्घकाल में solar + storage और nuclear प्रमुख ऊर्जा स्रोत होंगे
- इसमें advanced nuclear (SMR, fusion आदि) शामिल हैं
- अगर nuclear अन्य सभी विकल्पों की तुलना में आर्थिक रूप से बहुत सस्ता हो जाए, तो बदलाव बहुत तेज़ी से होगा
- इतिहास बताता है कि कहीं अधिक सस्ते ऊर्जा स्रोत की ओर दुनिया बहुत तेज़ी से बढ़ती है
- nuclear धरती पर, या कहीं भी, ऊर्जा का सबसे सस्ता रूप होना चाहिए
monetization और user trust
- Sora video generation की लागत अधिक है, इसलिए नए monetization model की ज़रूरत है
- लोग group chat में अपने और दोस्तों के मज़ेदार memes बनाते हैं—ऐसे अप्रत्याशित उपयोग पैटर्न सामने आए हैं
- जो लोग इसे दिन में सैकड़ों बार इस्तेमाल करते हैं, उनके लिए अलग monetization तरीका चाहिए
- GPU लागत अधिक होने के कारण pay-per-generation मॉडल की ज़रूरत पड़ेगी
- content creation को लेकर पारंपरिक धारणाएँ बदल रही हैं
- पारंपरिक मॉडल: 1% content बनाते हैं, 10% comments करते हैं, 100% देखते हैं
- वास्तव में बहुत अधिक लोग content बनाना चाहते हैं, बस यह पहले कठिन था
- ads के लिए openness है, लेकिन trust बनाए रखना सबसे अहम है
- “यह सिर्फ़ उसी हद तक संभव है जहाँ user trust को नुकसान न पहुँचे”
- Instagram ads को net value जोड़ने वाले अच्छे उदाहरण के रूप में बताया गया (ऐसे products की खोज जो पहले पता नहीं थे)
- ChatGPT और यूज़र के बीच की ऊँची trust relationship को तोड़ा नहीं जाना चाहिए
- अगर “मुझे कौन-सा coffee maker खरीदना चाहिए?” के जवाब में सर्वश्रेष्ठ विकल्प की जगह भुगतान लेकर कोई product सुझाया गया, तो trust खो जाएगा
शुरुआती OpenAI पर पुनरावलोकन
- शुरुआती OpenAI बिज़नेस से अधिक research-केंद्रित था, लेकिन CEO के रूप में “operations और organization की psychological complexity को सीखना” सबसे बड़ा बदलाव रहा
- शुरुआती कुछ साल उनके पेशेवर जीवन के सबसे मज़ेदार समय थे, जब वे सबसे बुद्धिमान लोगों के साथ lab चला रहे थे और ऐतिहासिक काम कर रहे थे
- ChatGPT लॉन्च के बाद जीवन पूरी तरह बदल गया। लगभग 3 साल बीत चुके हैं, और समय के साथ चीज़ें थोड़ी और पागल होती गईं, लेकिन अब इसकी आदत हो गई है
- investor से CEO बनने का संक्रमण
- कंपनी चलाने के लिए कोई स्वाभाविक fit नहीं था
- investor के रूप में सलाह देने वाली मानसिकता से निकलकर यह समझना पड़ा कि अब वास्तव में कंपनी चलानी है
- समय के साथ operations चलाने के लिए क्या चाहिए, इस बारे में बहुत कुछ सीखा
भविष्य के लिए सलाह
> “अगली पीढ़ी की दिग्गज कंपनियाँ OpenAI की नकल करके नहीं, बल्कि OpenAI द्वारा बनाए गए तकनीकी आधार के ऊपर नई तरह से उभरेंगी”
> “भविष्य की इंडस्ट्री का अनुमान लगाने की कोशिश ज़्यादातर गलत साबित होती है; सही रास्ता है खुद बनाना, प्रयोग करना और सीखना”
- गहरी विनम्रता का सबक: भविष्यवाणियाँ लगभग हमेशा गलत होती हैं
- आरामकुर्सी पर बैठकर quarterback बनने की कोशिश करने से आप समझदार लग सकते हैं, लेकिन आप वही कह रहे होते हैं जो लगभग बाकी सब कहते हैं
- सही conviction हासिल करना सचमुच कठिन है
- एकमात्र तरीका यही है कि विचारों की खोज की अग्रिम पंक्ति में गहराई से शामिल रहा जाए
- बहुत से लोगों से बात करना, चीज़ें बनाना, तकनीक के साथ खेलना, और दुनिया में सक्रिय रहना
- इस तरह की चीज़ों को support करने के लिए investors की इच्छा निराशाजनक रूप से कम है
- अधिकांश कंपनियाँ सिर्फ़ मौजूदा trends का पीछा करती हैं
- उम्मीद है कि लोग नई चीज़ें आज़माएँगे
AGI के बाद की दुनिया पर दृष्टि
- Altman के अनुसार, “AI विज्ञान, ऊर्जा और पूरी अर्थव्यवस्था में निरंतर प्रगति को आगे बढ़ाने वाली मुख्य शक्ति है”
- AI बाकी हर चीज़ का अध्ययन और अवलोकन करने के प्रति आकर्षित होगा : उम्मीद है कि उसकी रुचि पूरे human algorithm में होगी
- यदि OpenAI अपना मिशन पूरा कर लेता है, तो लगभग मुफ़्त के बराबर लागत पर बड़े पैमाने का AGI संभव हो सकता है
- ठोस भविष्यवाणियाँ करना कठिन है, लेकिन तकनीक के साथ प्रयोग करके, लोगों से बात करके और दुनिया में सक्रिय रहकर खोज करनी होगी
- AGI कोई विस्फोटक परिवर्तन नहीं होगा, बल्कि एक सतत विकास प्रक्रिया के रूप में समाज में समाएगा, और मानवता AI के साथ “निरंतर सह-सीखने के युग” में प्रवेश कर रही है
अभी कोई टिप्पणी नहीं है.