GPT-5: देर से लॉन्च, ज्यादा आंका गया, अपेक्षा से कम—और उससे भी बड़ी चिंता

(garymarcus.substack.com)

6 पॉइंट द्वारा GN⁺ 2025-08-11 | 5 टिप्पणियां | WhatsApp पर शेयर करें

GPT-5 के सार्वजनिक होने के बाद अपेक्षा के विपरीत समुदाय की निराशा काफी बढ़ गई
GPT-5 पूर्व मॉडल के मुकाबले वास्तविक रूप से उल्लेखनीय रूप से अलग नहीं है, बल्कि कुछ benchmark में प्रदर्शन में गिरावट भी देखी गई
हालिया शोध से यह स्पष्ट हुआ कि बड़े भाषा मॉडल (LLM) की generalization सीमा और distribution shift समस्या अभी भी गंभीर है
OpenAI में तकनीकी नेतृत्व के क्षरण, प्रमुख प्रतिभाओं के पलायन और प्रतिस्पर्धी कंपनियों की तेज़ रफ़्तार के कारण कंपनी का मूल्य बरकरार रहेगा या नहीं, यह अस्पष्ट हो गया है
AGI के दावों पर भरोसा घटा है, और पूरी AI इंडस्ट्री में ‘सिर्फ स्केलिंग’ दृष्टिकोण की सीमा को लेकर जागरूकता बढ़ रही है

GPT-5 का लॉन्च और अपेक्षाएँ

OpenAI की लंबे समय से दी गई घोषणाओं के बाद आखिरकार GPT-5 सार्वजनिक हुआ
CEO Sam Altman ने लॉन्च के पहले और बाद में आत्मविश्वास भरे बयानों तथा आक्रामक मार्केटिंग इमेजरी का भरपूर उपयोग किया
फिर भी GPT-5 के रिलीज़ के बाद, कुछ इन्फ्लुएंसरों को छोड़कर अधिकांश समुदाय में निराशा हावी रही
नए मॉडल को लेकर उपयोगकर्ता काफी निराश हुए, और कई जगह पुराने वर्जन पर वापस लौटने की माँग वाली याचिकाएँ तक पास हुईं
Altman के दावों और मार्केटिंग के उलट, वास्तविक उपयोग समीक्षा का रुझान स्पष्ट रूप से नकारात्मक रहा

समुदाय और मीडिया की प्रतिक्रिया

OpenAI Reddit, Hacker News आदि कई समुदायों में errors, hallucination जैसे GPT-5 के मुद्दों पर तेज़ चर्चा हुई
मुख्य performance benchmarks में Grok 4 जैसे प्रतिस्पर्धी मॉडलों से पीछे रहना भी देखा गया
automatic routing जैसी नई सुविधाओं में भी अव्यवस्था और अधूरापन सामने आया
जब समुदाय की अपेक्षा अचानक बहुत ऊँची थी, तब GPT-5 ने उल्टा बड़ा निराशाजनक अनुभव दिया
लॉन्च के दिन Polymarket सर्वे में OpenAI AI leadership पर भरोसा 1 घंटे में 75% से घटकर 14% रह गया

संरचनात्मक सीमाएँ: शतरंज, विज़ुअल समझ और रीज़निंग समस्याएँ

लेखकों और कई विशेषज्ञों ने पहले ही जिस मूलभूत reasoning errors और chess नियम पालन की विफलता की ओर इशारा किया था, वे अभी भी मौजूद हैं
image generation जैसे क्षेत्रों में part-whole संबंध, दृश्यात्मक consistency में स्पष्ट सीमाएँ दिखीं
ऐसा स्तर भी गलतियों से भर गया, जिसमें एक मशीन इंजीनियरिंग PhD और आम आदमी भी गलती नहीं करते
summarization और reading comprehension जैसे बेसिक tasks में भी कई गलतियों की रिपोर्ट सामने आई
GPT-5 एक क्रमिक सुधार वाला मॉडल तो है, पर पिछले साल के मुकाबले कोई बड़ा बदलाव दिखाई नहीं देता

OpenAI की वर्तमान स्थिति और भविष्य

GPT-5 पूर्व संस्करणों की तुलना में केवल धीरे-धीरे सुधार के स्तर तक सीमित रहा, और गंभीर खामियाँ बार-बार दोहराईं
बाजार और उद्योग में OpenAI के तकनीकी नेतृत्व पर भरोसा लगातार गिर रहा है
कई मुख्य कर्मचारियों के बाहर जाने के बाद प्रतिस्पर्धी कंपनियाँ बनना या जॉइन करना, और Anthropic, Google, Elon Musk का तेज़ी से आगे आना
price cuts का दबाव, profitability की चुनौती और Microsoft के साथ रिश्तों का बिगड़ना आदि संरचनात्मक जोखिम को बढ़ा रहे हैं
LLM-आधारित AGI की वास्तविकता पर संशय और CEO Sam Altman पर भरोसे में कमी और गहरी हो रही है

LLM की मूलभूत सीमा: सामान्यीकरण और distribution shift समस्या

Arizona State University की नई शोध रिपोर्ट से यह भी सामने आया कि Chain of Thought reasoning भी training distribution से बाहर होने पर टूट जाती है
Apple जैसी अन्य कंपनियों द्वारा पहले ही बताई गई distribution shift से कमजोरी वही structure में नई models में भी पाया गया
यह संकेत देता है कि LLM बार-बार qualitative सीमा से टकराते हैं, और सिर्फ भारी parameter count से इसे पार नहीं किया जा सकता
अरबों डॉलर खर्च करने वाली scaling strategy भी मूल समस्या के समाधान में विफल रही
नई paradigm खोजने की ज़रूरत अब व्यापक रूप से महसूस की जा रही है

AI उद्योग और ‘स्केलिंग’ की सीमा

AGI, self-driving, और inflated timelines जैसी अतिरंजित मार्केटिंग व्यापक है
distorted benchmarks, black-box evaluation और transparency की कमी गंभीर रूप से मौजूद हैं
कई लोगों को महसूस होने लगा है कि ‘AGI’ शब्द निवेशकों और जनता को लुभाने का औजार बन चुका है
AI के प्रति बढ़ती सकारात्मक उम्मीदों के साथ इसे जल्दी दिखाने का दबाव भी बढ़ा है
सिर्फ स्केलिंग अप्रोच अब वास्तविकता में एक dead-end पर पहुँच चुकी है

विकल्प और निष्कर्ष

GPT-5 शायद पहले की तुलना में सस्ता हुआ हो, लेकिन शतरंज, reasoning, visual और गणितीय क्षमता जैसे क्षेत्रों की गुणात्मक सीमाएँ अब भी कायम हैं
Grok, Claude, Gemini जैसी प्रतिस्पर्धी मॉडल श्रृंखलाएँ भी समान समस्याएँ दोहरा रही हैं
distribution shift की समस्या अभी भी अनसुलझी है
अब यह तर्क मजबूत होता जा रहा है कि neurosymbolic AI और world-model आधारित approaches जैसी नई दिशाएँ जरूरी हैं
AGI के लिए केवल स्केलिंग नहीं, बल्कि complex algorithmic innovation अनिवार्य तत्व है

आगे के मुद्दे की झलक और PS

सिर्फ इस सप्ताह सामने आई LLM सीमाओं के अलावा, एक और गंभीर वैज्ञानिक मुद्दे के उजागर होने की संभावना बताई गई
अगली follow-up पोस्ट में अलग अपडेट साझा करने की घोषणा

सारांश

GPT-5 के लॉन्च और बाद की industry/community अपेक्षा व प्रतिक्रियाओं, LLM की संरचनात्मक सीमाओं, OpenAI के भविष्य और AGI फ्रेमवर्क की वास्तविकता पर व्यापक विमर्श हुआ
कुल मिलाकर सामग्री startup और IT professionals के लिए LLM, GPT-5 की वास्तविक सीमाएँ, AI निवेश/आशा/निराशा, innovation और research trend जैसे बिंदुओं पर महत्त्वपूर्ण संकेत देती है

5 टिप्पणियां

gnsdl116 2025-08-12

लगता है यह अति-निराशावादी नज़रिया है।
चिंताओं को समझा जा सकता है, लेकिन तकनीकी विकास की प्रक्रिया हमेशा सिर्फ ऊपर की ओर ही नहीं बढ़ती।

mammal 2025-08-11

और ऊपर से पोस्ट लिखने वाला आदमी ही Gary Marcus था, जो हमेशा ऊल‑जलूल बातें करता रहता है, इसलिए...

dongho42 2025-08-11

गूगल की तरह अगर बस चुपचाप show&prove किया होता, तो शायद यह इतना आगे नहीं बढ़ता। पिछले दिनों ‘बहुत डरावना है’, ‘डैथ स्टार क्या करेगा’, ‘न्यूक्लियर बम बना दिया’ जैसी हाइप पर हाइप जमाकर छोड़ दी थी—अब लगता है कि वही सब अपने ही किए का फल है।