जेनसन हुआंग: Nvidia का भविष्य, Physical AI और Agents का उदय [YouTube]

(youtube.com)

6 पॉइंट द्वारा GN⁺ 2026-03-20 | 5 टिप्पणियां | WhatsApp पर शेयर करें

Nvidia के CEO जेनसन हुआंग All-In पॉडकास्ट में शामिल हुए और Groq अधिग्रहण, inference explosion, Physical AI, agent computing, AI उद्योग के PR संकट जैसे व्यापक विषयों पर बात की
Nvidia एक GPU कंपनी से विकसित होकर AI factory company बन गई है, और agent processing के लिए heterogeneous computing architecture में Groq LPU, BlueField, CPU और networking processors जोड़े हैं
Open Claw को आधुनिक AI computing के operating system blueprint के रूप में आंका गया, और memory system, skills, scheduling, IO subsystem से लैस पहले personal AI computer के रूप में परिभाषित किया गया
Physical AI 50 ट्रिलियन डॉलर के बाज़ार वाला वह क्षेत्र है जिसे tech industry पहली बार संबोधित कर रही है, और यह अभी लगभग 10 बिलियन डॉलर वार्षिक के करीब पहुँच चुका exponential growth वाला व्यवसाय है
AI उद्योग के PR संकट पर उन्होंने चेतावनी दी कि tech leaders के अतिवादी और प्रलयकारी बयान policy makers और आम लोगों पर नकारात्मक असर डालते हैं, इसलिए अधिक संयमित और संतुलित संवाद की ज़रूरत है

Groq अधिग्रहण और inference explosion

ढाई साल पहले पेश किए गए AI factory operating system Dynamo की मुख्य तकनीक disaggregated inference है, जिसमें inference processing pipeline को विभाजित करके अलग-अलग GPU पर चलाया जाता है
disaggregated computing की इसी अवधारणा ने Mellanox अधिग्रहण की दिशा बनाई, और आज Nvidia computing GPU, CPU, switches, scale-up/scale-out switches, networking processors तक फैली हुई है
- अब इसमें Groq भी जोड़कर उपयुक्त workload को उपयुक्त chip पर रखने वाली संरचना बनाई गई है
agent processing के युग में जाते हुए working memory, long-term memory, tool use, storage की मांग तेज़ी से बढ़ रही है
- data center के भीतर large models, small models, diffusion models, autoregressive models जैसे कई model types साथ मौजूद हैं
Vera Rubin ऐसा system है जिसे इन बेहद विविध workloads को चलाने के लिए डिज़ाइन किया गया है
- मौजूदा 1-rack configuration में 4 rack और जोड़े गए, जिससे Nvidia का TAM लगभग 33~50% बढ़ा
- यह अतिरिक्त हिस्सा storage processor (BlueField), Groq processor, CPU और networking processor से बना है
data center की कीमत और token cost को एक जैसा नहीं मानना चाहिए
- 50 बिलियन डॉलर की factory सबसे कम लागत वाले token बना सकती है, क्योंकि 10x throughput efficiency मिलती है
- 20 बिलियन डॉलर तो जमीन, बिजली और shell cost में जाते हैं, और storage, networking, CPU, server, cooling तो वैसे भी चाहिए
- GPU कीमत 1x हो या 0.5x, फर्क 50 बिलियन बनाम 40 बिलियन जैसा है, जो 10x throughput के मुकाबले बहुत बड़ा अनुपात नहीं है
पिछले साल कहा गया था कि inference 1,000x बढ़ेगा, लेकिन अब यह 10 लाख x, 1 अरब x के स्तर तक जा सकता है
- उस समय दुनिया pre-scaling और training पर केंद्रित थी, लेकिन अब inference विस्फोटक रूप से बढ़कर inference constrained स्थिति में पहुँच गया है

दुनिया की सबसे मूल्यवान कंपनी में निर्णय कैसे लिए जाते हैं

CEO की भूमिका vision और strategy को परिभाषित करना है, और बेहतरीन computer scientists व engineers की जानकारी के आधार पर भविष्य को आकार देना है
मुख्य मानदंड: क्या यह पागलों जैसा कठिन काम है, क्या यह पहले कभी नहीं किया गया, और क्या यह Nvidia की विशेष superpower से मेल खाता है
- अगर काम आसान है तो प्रतियोगी बहुत होंगे, इसलिए उससे बचना चाहिए
- बेहद कठिन काम में पीड़ा होती है, इसलिए उस प्रक्रिया का आनंद लेना आना चाहिए

Physical AI का 50 ट्रिलियन डॉलर बाज़ार और Open Claw

Physical AI tech industry के लिए पहली बार 50 ट्रिलियन डॉलर के उद्योग को संबोधित करने का अवसर है
- इसकी शुरुआत 10 साल पहले हुई थी, और अब यह लगभग 10 बिलियन डॉलर वार्षिक के करीब पहुँचता exponential growth business है
computing systems की 3 श्रेणियाँ
- पहली: AI model training और development के लिए computer
- दूसरी: evaluation computer — physics laws का पालन करने वाले virtual environment में robots और cars का evaluation (Omniverse)
- तीसरी: edge robotics computer — autonomous vehicles, robots, teddy bears आदि
telecom base stations को AI infrastructure का हिस्सा बनाने का काम जारी है
- 2 ट्रिलियन डॉलर का telecom industry, AI infrastructure का विस्तार बन जाएगा
digital biology ChatGPT moment के करीब है
- genes, proteins और cells की representation व dynamics को 2~5 साल में समझ पाना संभव होगा
- 5 साल के भीतर digital biology healthcare industry में inflection point पर पहुँच जाएगी
Open Claw पिछले 2 साल के 3 inflection points में तीसरा है
- पहला: ChatGPT — generative AI को जन-चेतना में लाया
- दूसरा: o1/o3 — reasoning और evidence-based information के ज़रिए economic model में inflection
- तीसरा: Claude Code — पहला उपयोगी agent system, लेकिन enterprise तक सीमित; Open Claw ने AI agent की अवधारणा को जन-चेतना में स्थापित किया
Open Claw के computing model की संरचना
- memory system: scratchpad (short-term memory), file system
- skills: API के जरिए कई प्रकार के applications चलाना
- resource management·scheduling: cron jobs, agent spawn, task decomposition
- IO subsystem: input/output, WhatsApp connection आदि
- ये 4 तत्व मूल रूप से computer को परिभाषित करते हैं → पहला open-source personal AI computer
agent software में governance·security योगदान
- ऐसी policy कि sensitive information access, code execution और external communication — इन तीनों को एक साथ अनुमति न दी जाए
- Peter Steinberger और Nvidia engineers ने security hardening में योगदान दिया

AI का PR संकट और Anthropic communication समस्या

AI न तो कोई जैविक अस्तित्व है, न alien, न ही सचेतन; यह computer software है
"हम इसे बिल्कुल समझते ही नहीं" कहना तथ्यात्मक नहीं है; हम इस तकनीक के बारे में बहुत कुछ समझते हैं
policy makers को लगातार जानकारी देना ज़रूरी है, और प्रलयवाद व अतिवाद को policy decisions पर असर नहीं डालने देना चाहिए
- साथ ही, तकनीक बहुत तेज़ी से बदल रही है, इसलिए policy तकनीक से बहुत आगे नहीं निकलनी चाहिए
अमेरिका की सबसे बड़ी national security चिंता यह है कि दूसरे देश AI अपना लें जबकि अमेरिका AI से गुस्से, डर या paranoia के कारण उसे अपनाने से चूक जाए
Anthropic के बारे में: तकनीक शानदार है और security व safety पर उसका फोकस सम्मानजनक है
- लेकिन तकनीक के खतरे के बारे में चेतावनी देना अच्छा है, डराना उतना अच्छा नहीं
- बिना सबूत के अतिवादी और विनाशकारी बयान लोगों की सोच से भी अधिक नुकसानदेह हो सकते हैं
- tech leader के रूप में शब्दों का वजन समझना चाहिए और अधिक संयमित, मध्यम, संतुलित और विचारशील होना चाहिए
अमेरिका में AI की लोकप्रियता 17% है, और यह nuclear industry की तरह shutdown की राह पर जा सकता है
- चीन में 100 nuclear fission reactors बन रहे हैं, जबकि अमेरिका में 0
- data center moratorium जैसी बातें भी सामने आ रही हैं

revenue क्षमता, employee token allocation और agents का भविष्य

AI model usage ranking: 1st OpenAI, 2nd open source (बहुत बड़े अंतर से), 3rd Anthropic
computing demand में वृद्धि
- generative → reasoning: लगभग 100x
- reasoning → agents: लगभग 100x
- 2 साल में computing 10,000x बढ़ चुकी है
लोग जानकारी के लिए पैसे देते हैं, लेकिन काम (work) के लिए उससे भी ज़्यादा पैसे देते हैं
- agent systems काम करके देते हैं → consumption अभी लगभग 100x बढ़ रहा है, और scaling अभी शुरू भी नहीं हुई
Nvidia के 43,000 कर्मचारियों में लगभग 38,000 engineer हैं
- 500,000 डॉलर salary वाले engineer अगर सालाना सिर्फ 5,000 डॉलर tokens पर खर्च करें तो यह बड़ी समस्या है
- कम से कम 250,000 डॉलर से अधिक token spending की अपेक्षा है
- यह वैसा ही है जैसे chip designer कहे, "मैं सिर्फ कागज़ और पेंसिल इस्तेमाल करूंगा, CAD tools की ज़रूरत नहीं"
Auto Research उदाहरण
- desktop पर 30 मिनट में किया गया research आम तौर पर 7 साल लेने वाली PhD thesis के स्तर का था
- GitHub से डाउनलोड करके local पर चलाया गया, और scientific journal स्तर का परिणाम मिला
- 600 lines of code वाला tool, जो वीकेंड पर जारी किया गया
भविष्य का काम करने का तरीका: सीधे code लिखने के बजाय ideas, architecture, specifications लिखना, टीमों को संगठित करना और evaluation criteria परिभाषित करना
- हर engineer के पास 100 agents होंगे

enterprise software का भविष्य

इस विचार का खंडन कि enterprise IT software industry नष्ट हो जाएगी
- enterprise software अब तक लोगों और seats (butts and seats) से सीमित रहा है
- जल्द ही 100x अधिक agents SQL, vector databases, Blender, Photoshop जैसे मौजूदा tools इस्तेमाल करेंगे
- मौजूदा tools काम अच्छे से करते हैं, और अंतिम output को ऐसे रूप में व्यक्त करने का माध्यम हैं जिसे user control कर सके

open source, global diffusion, Iran/Taiwan supply chain

model technology है, product नहीं; technology है, service नहीं
- proprietary models और open-source models दोनों मूल रूप से ज़रूरी हैं (A or B नहीं, A and B)
- सामान्य consumer ChatGPT, Claude, Gemini जैसे horizontal layer की general intelligence पसंद करेंगे
- industry-specific domain expertise और specialization सिर्फ open models में संभव है
open-source models frontier के करीब पहुँच चुके हैं, और frontier पर पहुँचने के बाद भी service-based models फलते-फूलते रहेंगे
global diffusion की स्थिति
- Biden युग के diffusion rules, anti-American AI diffusion policy थे
- President Trump चाहते हैं कि अमेरिकी tech industry दुनिया का नेतृत्व करे और technology फैले
- Nvidia ने दुनिया के दूसरे सबसे बड़े बाज़ार (चीन) में 95% market share छोड़ा और अभी 0% पर है
- Secretary Lutnik से स्वीकृत license मिल गया है, चीन की कंपनियों से purchase orders मिले हैं और supply chain फिर चालू की जा रही है
national security के नज़रिए से
- अगर छोटे motors, rare earth minerals, telecom networks और sustainable energy पर नियंत्रण न हो तो national security कमज़ोर होती है
- AI industry को solar, rare earths, magnets, motors, telecom जैसा नहीं बनना चाहिए
- अमेरिकी tech stack (chip ~ computing system ~ platform) का दुनिया के 90% हिस्से पर होना वांछनीय है
Taiwan: अमेरिका को reindustrialization अधिकतम तेजी से आगे बढ़ानी चाहिए, और Taiwan supply chain के साथ strategic partnership और friendship बनाए रखते हुए Arizona, Texas, California में तेज़ manufacturing करनी चाहिए
- Korea, Japan, Europe तक supply chain diversification की ज़रूरत है
- diversification और resilience बनाते समय धैर्य और संयम चाहिए
helium: यह समस्या बन सकता है, लेकिन supply chain में पर्याप्त buffer होने की संभावना है

autonomous driving platforms और competition

"जो कुछ भी चलता है, वह एक दिन पूरी या आंशिक रूप से autonomous होगा"
Nvidia खुद autonomous car नहीं बनाएगी, बल्कि हर car company को बनाने में सक्षम करेगी
- training computer, simulation/evaluation computer और vehicle computer — ये तीनों बनाती है
- दुनिया की पहली reasoning-based autonomous car — जटिल scenarios को सरल scenarios में तोड़कर खोजने वाली Alpommyo system
Tesla सिर्फ training computer खरीदती है, जबकि दूसरी कंपनियाँ पूरा stack इस्तेमाल करती हैं — यानी लचीला partnership model
Google TPU, Amazon Inferentia/Tranium जैसी स्थिति, जहाँ customer ही competitor बन जाता है
- Nvidia का आत्मविश्वास: जब तक वह सर्वोत्तम तकनीक से प्रतिस्पर्धा करते हुए तेज़ दौड़ती रहे, Nvidia से खरीदना सबसे economical रहेगा
- हर cloud में मौजूद एकमात्र architecture — cloud से on-premise, vehicle, किसी भी region, यहाँ तक कि space तक
- कारोबार का लगभग 40% हिस्सा ऐसा है जिसे full stack के बिना ग्राहक उपयोग ही नहीं कर सकते, यानी पूरी AI factory बनाने की क्षमता चाहिए
market share बढ़ने के कारण
- Anthropic Nvidia पर आया, Meta भी Nvidia पर आया, open models बढ़े — सब Nvidia आधारित
- cloud के बाहर enterprise, industry और edge की वृद्धि
- AWS ने आने वाले कुछ वर्षों में 10 लाख chips खरीदने की घोषणा की
analysts की growth slowdown predictions (अगले साल 30%, उसके बाद 20%, 2029 में 7%) पर
- वे AI के पैमाने और दायरे को नहीं समझ रहे
- ज़्यादातर लोग सोचते हैं AI केवल top 5 hyperscalers तक सीमित है, जबकि वास्तव में यह कहीं अधिक व्यापक है

space data centers, AI healthcare, robotics

space data centers
- Nvidia पहले ही space में पहुँच चुकी है — radiation-hardened CUDA दुनिया भर के satellites में imaging और AI image processing कर रहा है
- space में मौजूद हर data को Earth पर भेजने के बजाय space में ही imaging process करना अधिक तर्कसंगत है
- space में energy भरपूर है, लेकिन conduction या convection cooling संभव नहीं — सिर्फ radiation से cooling हो सकती है, इसलिए बहुत बड़े surface area की ज़रूरत होती है
- space data center architecture को समझने में कई साल लग सकते हैं
AI healthcare के 3 क्षेत्र
- AI biology: AI से जैविक व्यवहार को represent और predict करना → drug discovery
- AI agents: diagnosis support आदि — Open Evidence, Hypocratic जैसे उदाहरण
- Physical AI: physics laws समझने वाला AI → robotic surgery आदि
- भविष्य में ultrasound, CT जैसी hospital की हर मशीन agent बन जाएगी — Open Claw का सुरक्षित संस्करण हर उपकरण में built-in होगा
robotics
- अमेरिका ने इस उद्योग का अधिकांश आविष्कार किया, लेकिन मुख्य तकनीक (brain = AI) आने से लगभग 5 साल पहले ही थक गया
- high-function existence proof से reasonable product तक पहुँचने में तकनीक को 2~3 cycles (3~5 years) से ज़्यादा नहीं लगते
- चीन microelectronics, motors, rare earths, magnets में दुनिया में सबसे आगे है → global robotics industry चीन के ecosystem और supply chain पर बहुत निर्भर है
- robots वे काम संभव बनाएँगे जो व्यक्ति अकेले नहीं कर सकता, इसलिए वे economic mobility और prosperity का सबसे बड़ा unlock होंगे
- अभी अमेरिका लाखों workers की कमी से जूझ रहा है, इसलिए robotics की बेहद ज़रूरत है
- robots के जरिए virtual presence, प्रकाश की गति से movement, Moon और Mars colonization के प्रमुख साधन संभव होंगे

OpenAI/Anthropic की revenue potential और AI moat

Dario Amodei ने 2027~28 तक सैकड़ों बिलियन डॉलर, और 2030 तक 1 ट्रिलियन डॉलर non-infrastructure AI revenue का अनुमान लगाया
- Jensen ने इसे बहुत conservative बताया और कहा कि Anthropic इससे कहीं बेहतर कर सकती है
- अभी एक हिस्सा गणना में नहीं है: हर enterprise software company Anthropic·OpenAI tokens की value-added reseller बन जाएगी
- go-to-market logarithmically scale करेगा
AI युग का moat है deep specialization
- general models agent systems से जुड़े होंगे, और कई models ऐसे specialized sub-agents होंगे जिन्हें कंपनियाँ खुद train करेंगी
- entrepreneurs के लिए संदेश: अपने vertical को सबसे गहराई से समझो, और tools बेहतर होने पर उसमें अपना ज्ञान inject करो
- जितनी जल्दी agents को customers से जोड़ोगे, उतनी जल्दी flywheel चलेगा और agents बेहतर बनेंगे
- आज के horizontal platforms के विपरीत, platform companies के लिए experts और vertical domain specialists बनने का अवसर है

AI युग के युवाओं के लिए सलाह

deep science, deep mathematics, language ability की सिफारिश
- क्योंकि language ही AI की programming language है, इसलिए English literature major भी सबसे सफल हो सकता है
आप कोई भी शिक्षा लें, AI के उपयोग में गहरे विशेषज्ञ बनना चाहिए
- जरूरत से ज़्यादा निर्देश दिए बिना (overprescribe), AI को innovate और create करने की जगह छोड़ते हुए उसे इच्छित परिणाम तक ले जाना एक artistry है
radiologist का उदाहरण
- 10 साल पहले भविष्यवाणी की गई थी कि computer vision radiology को पूरी तरह replace कर देगा → computer vision 100% integrate हो गया
- लेकिन radiologists की संख्या उल्टा बढ़ गई, क्योंकि demand तेज़ी से बढ़ी
- scans तेज़ हुए, इसलिए और scans हुए → और patients process हुए → hospitals की revenue बढ़ी
- पेशे का task बदलता है, लेकिन उसका purpose बना रहता है
productivity बढ़ने पर देश और समृद्ध बन सकता है, जिससे classrooms में ज़्यादा teachers लगाए जा सकेंगे और हर student को personalized curriculum दिया जा सकेगा
job transition अनिवार्य है, लेकिन autonomous driving से 1,000~1,500 lakh driving jobs बदलेंगी
- chauffeur जैसे roles mobility assistant में बदल सकते हैं — जब car खुद चल रही हो, तब वे passenger के लिए अलग-अलग काम कर सकें
- जैसे aircraft autopilot ने ज़्यादा pilots पैदा किए, वैसा ही पैटर्न यहाँ भी हो सकता है

5 टिप्पणियां

xguru 2026-03-20

24:28 से आगे का हिस्सा प्रभावशाली है।

ज़रा एक thought experiment करते हैं।

मान लीजिए, कोई software engineer या AI researcher है जिसकी सालाना सैलरी 5 लाख डॉलर है। हमारे यहाँ ऐसे मामले आम हैं।

साल के अंत में मैं उस 5 लाख डॉलर सालाना पाने वाले engineer से पूछूँगा:
“इस साल आपने tokens पर कितना खर्च किया?”
और अगर वह कहे, “मैंने 5,000 डॉलर खर्च किए,” तो मैं सच में हैरान रह जाऊँगा।

अगर उस 5 लाख डॉलर सालाना पाने वाले engineer ने कम-से-कम 2.5 लाख डॉलर के tokens भी इस्तेमाल नहीं किए, तो मैं इसे बहुत गंभीरता से लूँगा।

यह वैसा ही है जैसे हमारे chip designers में से कोई कहे,
“मैं तो बस कागज़ और पेंसिल ही इस्तेमाल करूँगा। मुझे CAD tools की ज़रूरत नहीं लगती।”

इसका मतलब है कि अब top talent को देखने का नज़रिया ही पूरी तरह बदल रहा है।

यह कुछ वैसा ही है जैसा हमने तब सीखा था जब NBA में LeBron James ने अपने शरीर की देखभाल और अपनी condition बनाए रखने पर
हर साल 10 लाख डॉलर खर्च करने शुरू किए थे।

तो फिर ऐसे बेहतरीन knowledge workers को superhuman capabilities क्यों न दी जाएँ?

तो 2–3 साल आगे देखकर सवाल यह है:
Nvidia का एक top talent कितना ज़्यादा efficiently काम करेगा?
और वह आखिर कितनी दूर तक जा सकेगा?

सबसे पहले, “वाह, यह बहुत मुश्किल है” वाला विचार गायब हो जाएगा।
“इसमें बहुत ज़्यादा समय लगेगा” वाला विचार भी गायब हो जाएगा।
“इसके लिए बहुत सारे लोगों की ज़रूरत है” वाला विचार भी गायब हो जाएगा।

बहुत बड़ा है, बहुत भारी है, बहुत समय लगता है।
ये सारे विचार खत्म हो जाएँगे।
आखिर में जो बचेगा, वह creativity होगी।
सिर्फ यही बचेगा कि आप क्या सोच सकते हैं।

तब सवाल यह होगा:
इन agents के साथ मिलकर काम कैसे किया जाए?

असल में, यही computer programming करने का नया तरीका है।
पहले हम खुद code लिखते थे।
आगे हम ideas लिखेंगे, architecture लिखेंगे, specifications लिखेंगे।

हम teams को organize करेंगे,
यह define करेंगे कि अच्छे और बुरे results का मूल्यांकन कैसे करना है,
यह तय करेंगे कि शानदार result किसे कहेंगे,
कैसे मिलकर iteration करना है,
और कैसे brainstorming करनी है।

वास्तव में महत्वपूर्ण काम यही है।

और मेरे विचार से,
आगे चलकर हर engineer के पास 100 agents होंगे।

aliveornot 2026-03-21

मतलब क्या है, यह तो समझ में आता है, लेकिन code lines की संख्या से engineers का आकलन करना सच में बेवकूफ़ी थी। अच्छा metric ढूँढ़ना वाकई मुश्किल लगता है।

aer0700 2026-03-21

5 lakh dollar वेतन पाने वाले engineer से यह पूछने के बजाय कि "आपने कितने tokens इस्तेमाल किए?",
क्या हमें यह नहीं पूछना चाहिए,
"आपने इस साल क्या develop किया, और उससे कंपनी के operating profit में क्या योगदान हुआ?"

kirkyoon 2026-04-23

सवाल यह नहीं है कि आपने कितने token खर्च किए, बल्कि यह है कि क्या आप उनका सही इस्तेमाल कर रहे हैं।
सिर्फ 5000 डॉलर खर्च किए, इसे शायद बहुत कम खर्च करने के मानक के रूप में समझना चाहिए।
यह कुछ ऐसा कहने से अलग नहीं है:
“मैं तो बस कागज़ और पेंसिल ही इस्तेमाल करूंगा। मुझे CAD tool की ज़रूरत नहीं लगती।”