6 पॉइंट द्वारा GN⁺ 2025-08-11 | 5 टिप्पणियां | WhatsApp पर शेयर करें
  • GPT-5 के सार्वजनिक होने के बाद अपेक्षा के विपरीत समुदाय की निराशा काफी बढ़ गई
  • GPT-5 पूर्व मॉडल के मुकाबले वास्तविक रूप से उल्लेखनीय रूप से अलग नहीं है, बल्कि कुछ benchmark में प्रदर्शन में गिरावट भी देखी गई
  • हालिया शोध से यह स्पष्ट हुआ कि बड़े भाषा मॉडल (LLM) की generalization सीमा और distribution shift समस्या अभी भी गंभीर है
  • OpenAI में तकनीकी नेतृत्व के क्षरण, प्रमुख प्रतिभाओं के पलायन और प्रतिस्पर्धी कंपनियों की तेज़ रफ़्तार के कारण कंपनी का मूल्य बरकरार रहेगा या नहीं, यह अस्पष्ट हो गया है
  • AGI के दावों पर भरोसा घटा है, और पूरी AI इंडस्ट्री में ‘सिर्फ स्केलिंग’ दृष्टिकोण की सीमा को लेकर जागरूकता बढ़ रही है

GPT-5 का लॉन्च और अपेक्षाएँ

  • OpenAI की लंबे समय से दी गई घोषणाओं के बाद आखिरकार GPT-5 सार्वजनिक हुआ
  • CEO Sam Altman ने लॉन्च के पहले और बाद में आत्मविश्वास भरे बयानों तथा आक्रामक मार्केटिंग इमेजरी का भरपूर उपयोग किया
  • फिर भी GPT-5 के रिलीज़ के बाद, कुछ इन्फ्लुएंसरों को छोड़कर अधिकांश समुदाय में निराशा हावी रही
  • नए मॉडल को लेकर उपयोगकर्ता काफी निराश हुए, और कई जगह पुराने वर्जन पर वापस लौटने की माँग वाली याचिकाएँ तक पास हुईं
  • Altman के दावों और मार्केटिंग के उलट, वास्तविक उपयोग समीक्षा का रुझान स्पष्ट रूप से नकारात्मक रहा

समुदाय और मीडिया की प्रतिक्रिया

  • OpenAI Reddit, Hacker News आदि कई समुदायों में errors, hallucination जैसे GPT-5 के मुद्दों पर तेज़ चर्चा हुई
  • मुख्य performance benchmarks में Grok 4 जैसे प्रतिस्पर्धी मॉडलों से पीछे रहना भी देखा गया
  • automatic routing जैसी नई सुविधाओं में भी अव्यवस्था और अधूरापन सामने आया
  • जब समुदाय की अपेक्षा अचानक बहुत ऊँची थी, तब GPT-5 ने उल्टा बड़ा निराशाजनक अनुभव दिया
  • लॉन्च के दिन Polymarket सर्वे में OpenAI AI leadership पर भरोसा 1 घंटे में 75% से घटकर 14% रह गया

संरचनात्मक सीमाएँ: शतरंज, विज़ुअल समझ और रीज़निंग समस्याएँ

  • लेखकों और कई विशेषज्ञों ने पहले ही जिस मूलभूत reasoning errors और chess नियम पालन की विफलता की ओर इशारा किया था, वे अभी भी मौजूद हैं
  • image generation जैसे क्षेत्रों में part-whole संबंध, दृश्यात्मक consistency में स्पष्ट सीमाएँ दिखीं
  • ऐसा स्तर भी गलतियों से भर गया, जिसमें एक मशीन इंजीनियरिंग PhD और आम आदमी भी गलती नहीं करते
  • summarization और reading comprehension जैसे बेसिक tasks में भी कई गलतियों की रिपोर्ट सामने आई
  • GPT-5 एक क्रमिक सुधार वाला मॉडल तो है, पर पिछले साल के मुकाबले कोई बड़ा बदलाव दिखाई नहीं देता

OpenAI की वर्तमान स्थिति और भविष्य

  • GPT-5 पूर्व संस्करणों की तुलना में केवल धीरे-धीरे सुधार के स्तर तक सीमित रहा, और गंभीर खामियाँ बार-बार दोहराईं
  • बाजार और उद्योग में OpenAI के तकनीकी नेतृत्व पर भरोसा लगातार गिर रहा है
  • कई मुख्य कर्मचारियों के बाहर जाने के बाद प्रतिस्पर्धी कंपनियाँ बनना या जॉइन करना, और Anthropic, Google, Elon Musk का तेज़ी से आगे आना
  • price cuts का दबाव, profitability की चुनौती और Microsoft के साथ रिश्तों का बिगड़ना आदि संरचनात्मक जोखिम को बढ़ा रहे हैं
  • LLM-आधारित AGI की वास्तविकता पर संशय और CEO Sam Altman पर भरोसे में कमी और गहरी हो रही है

LLM की मूलभूत सीमा: सामान्यीकरण और distribution shift समस्या

  • Arizona State University की नई शोध रिपोर्ट से यह भी सामने आया कि Chain of Thought reasoning भी training distribution से बाहर होने पर टूट जाती है
  • Apple जैसी अन्य कंपनियों द्वारा पहले ही बताई गई distribution shift से कमजोरी वही structure में नई models में भी पाया गया
  • यह संकेत देता है कि LLM बार-बार qualitative सीमा से टकराते हैं, और सिर्फ भारी parameter count से इसे पार नहीं किया जा सकता
  • अरबों डॉलर खर्च करने वाली scaling strategy भी मूल समस्या के समाधान में विफल रही
  • नई paradigm खोजने की ज़रूरत अब व्यापक रूप से महसूस की जा रही है

AI उद्योग और ‘स्केलिंग’ की सीमा

  • AGI, self-driving, और inflated timelines जैसी अतिरंजित मार्केटिंग व्यापक है
  • distorted benchmarks, black-box evaluation और transparency की कमी गंभीर रूप से मौजूद हैं
  • कई लोगों को महसूस होने लगा है कि ‘AGI’ शब्द निवेशकों और जनता को लुभाने का औजार बन चुका है
  • AI के प्रति बढ़ती सकारात्मक उम्मीदों के साथ इसे जल्दी दिखाने का दबाव भी बढ़ा है
  • सिर्फ स्केलिंग अप्रोच अब वास्तविकता में एक dead-end पर पहुँच चुकी है

विकल्प और निष्कर्ष

  • GPT-5 शायद पहले की तुलना में सस्ता हुआ हो, लेकिन शतरंज, reasoning, visual और गणितीय क्षमता जैसे क्षेत्रों की गुणात्मक सीमाएँ अब भी कायम हैं
  • Grok, Claude, Gemini जैसी प्रतिस्पर्धी मॉडल श्रृंखलाएँ भी समान समस्याएँ दोहरा रही हैं
  • distribution shift की समस्या अभी भी अनसुलझी है
  • अब यह तर्क मजबूत होता जा रहा है कि neurosymbolic AI और world-model आधारित approaches जैसी नई दिशाएँ जरूरी हैं
  • AGI के लिए केवल स्केलिंग नहीं, बल्कि complex algorithmic innovation अनिवार्य तत्व है

आगे के मुद्दे की झलक और PS

  • सिर्फ इस सप्ताह सामने आई LLM सीमाओं के अलावा, एक और गंभीर वैज्ञानिक मुद्दे के उजागर होने की संभावना बताई गई
  • अगली follow-up पोस्ट में अलग अपडेट साझा करने की घोषणा

सारांश

  • GPT-5 के लॉन्च और बाद की industry/community अपेक्षा व प्रतिक्रियाओं, LLM की संरचनात्मक सीमाओं, OpenAI के भविष्य और AGI फ्रेमवर्क की वास्तविकता पर व्यापक विमर्श हुआ
  • कुल मिलाकर सामग्री startup और IT professionals के लिए LLM, GPT-5 की वास्तविक सीमाएँ, AI निवेश/आशा/निराशा, innovation और research trend जैसे बिंदुओं पर महत्त्वपूर्ण संकेत देती है

5 टिप्पणियां

 
gnsdl116 2025-08-12

लगता है यह अति-निराशावादी नज़रिया है।
चिंताओं को समझा जा सकता है, लेकिन तकनीकी विकास की प्रक्रिया हमेशा सिर्फ ऊपर की ओर ही नहीं बढ़ती।

 
mammal 2025-08-11

और ऊपर से पोस्ट लिखने वाला आदमी ही Gary Marcus था, जो हमेशा ऊल‑जलूल बातें करता रहता है, इसलिए...

 
dongho42 2025-08-11

गूगल की तरह अगर बस चुपचाप show&prove किया होता, तो शायद यह इतना आगे नहीं बढ़ता। पिछले दिनों ‘बहुत डरावना है’, ‘डैथ स्टार क्या करेगा’, ‘न्यूक्लियर बम बना दिया’ जैसी हाइप पर हाइप जमाकर छोड़ दी थी—अब लगता है कि वही सब अपने ही किए का फल है।

 
dongho42 2025-08-11

और ऐलान/लॉन्च के दौरान जब उन्होंने बेंचमार्क दिखाया, तब जो बहुत ही बेसिर-पैर की गलती की, उसने भी शायद कुल मिलाकर पड़े इम्प्रेशन को खराब करने में योगदान दिया।

 
GN⁺ 2025-08-11
Hacker News टिप्पणी
  • मैं अभी भी मानता हूँ कि GPT‑5 असल में एक practical cost-saving strategy है, क्योंकि OpenAI जैसी growth-oriented कंपनी GPU-आधारित उत्पादों में 1 अरब users पाने के लक्ष्य के साथ काम कर रही है।

    • GPT‑5 Pro पर कोई खास चर्चा नहीं कर रहा, लेकिन मैंने खुद टेस्ट किया और यह Grok 4 Heavy तथा Opus 4.1 से काफ़ी बेहतर लगा।

    • यह पूरी तरह नई टेक्नोलॉजी पर है, और अगर मॉडल को पूरी क्षमता पर चलाएँ तो प्रति व्यक्ति प्रति महीने हज़ारों डॉलर खर्च हो सकते हैं।

    • इसलिए इसे वास्तविकता में सीमित स्तर पर ही उपलब्ध कराया जा रहा है; OpenAI का focus उस छोटे सेगमेंट पर नहीं बल्कि growth लेकर Google से सीधी भिड़ंत पर है।

    • Pro मॉडल का जिक्र कहीं नहीं दिखा, इसलिए मैं इस राय पर भरोसा नहीं कर पाता।

    • मेरे हिसाब से GPT‑5 Pro को o3-pro से कहीं बेहतर मानने का महसूस नहीं होता (शायद बिल्कुल नहीं), यह काफी धीमा है और आउटपुट क्वालिटी लगभग वही है।

      • अभी भी तेज़ी कम है और कई बार मुख्य point miss हो जाता है।
      • लेकिन समस्या समाधान के नए approach देने में थोड़ा बेहतर लगता है।
      • पहली impression यही थी कि 5-pro में knowledge करीब 0–2% ज्यादा और creativity/novelty लगभग 5–10% बेहतर है।
      • मॉडल का “टोन” या व्यक्तित्व लगभग वही है।
      • कुछ खास कामों (formal logic, data analysis, छोटे analytical tasks) में यह सचमुच शानदार है और Grok या किसी भी Gemini version से बेहतर।
      • लेकिन prose writing/सामान्य writing के लिए यह Kimi K2 और Deepseek R1 से साफ़ नीचे है।
      • खास बात यह है कि सबसे मजबूत अंग्रेज़ी prose लिखने वाले मॉडलों में Chinese players हैं—सिर्फ इसलिए नहीं कि यह GPT वाला “AI style” नहीं अपनाते, बल्कि Kimi का स्तर वास्तविक प्रकाशित कवियों के करीब है।
    • मैंने अपना network check किया, GPT‑5 Pro इस्तेमाल करने वाला कोई व्यक्ति नहीं मिला।

      • खासकर o3 के साथ direct comparison feedback सुनना दिलचस्प होगा।
    • मैं इस राय से सहमत हूँ, पर मेरा मानना है कि बेहतर मॉडल को public में छोड़ने का उद्देश्य भी है।

      • o3 बहुत अच्छा था, फिर भी कई लोग अभी भी use नहीं कर रहे थे।
      • ChatGPT daily इस्तेमाल करने वालों से पूछो कि उन्होंने o3 चलाया या नहीं, तो अजीब blank expression दिखता है।
      • इसलिए लगता है कि reasoning मॉडल को mass-market में लाना भी लक्ष्य है; निश्चित ही यह OpenAI की खर्च बढ़ा देता है।
      • लेकिन routing layer की वजह से power users (अधिकतर HN users) के हिसाब से cost saving का angle भी है।
      • हाँ, power users जल्दी ही reasoning मॉडल को force उपयोग करने का तरीका सीख जाएँगे।
    • Pro मॉडल API से शायद इस्तेमाल नहीं हो सकता, सही?

      • क्या इसे Codex CLI के ज़रिए subscription लिंक करके इस्तेमाल किया जा सकता है?
    • सहमत।

      • इस निर्णय के पीछे एक और कारण यह भी है कि ज़्यादातर users के लिए existing models पर्याप्त हैं।
      • HN users के उलट, normal users को latest तकनीक में उतनी दिलचस्पी नहीं।
  • मुझे इस तरह की टिप्पणियाँ अक्सर काफ़ी चिढ़ाती हैं।

    • सीधे खुद analyze करके यह नहीं लिखना कि क्यों GPT‑5 खराब लगा, बल्कि सोशल मीडिया रिएक्शन स्क्रैप करके हर criticism को “shocking” या “harsh criticism” बना देना—बस इसलिए कि अपनी राय मनवा सके।

    • यह बहुत biased है; न journalism है, न original analysis।

    • AI से जुड़ी खबरों में अक्सर basic curiosity की कमी लगती है, और अधिकतर मज़ाक या तंज़ पर जोर रहता है।

      • मैं AI पसंद करता हूँ, लेकिन अलग सोच वाला कोई गंभीर लेख हो तो पढ़ लेता हूँ।
      • लेकिन ऐसे लेख अलग category के हैं—opponent की आलोचना के अलावा कोई वास्तविक value नहीं दिखती।
      • HN की moderation ठीक लगती है; ऐसी curiosity-हीन पोस्टें main से हट जाएँ तो बेहतर।
    • Gary Marcus की analysis अक्सर बहुत उथली होती है।

      • उनके views कई मायनों में Jim Cramer की stock commentary जैसे लगते हैं।
      • उल्टा “Reverse Gary Marcus” strategy में bet लगाने लायक है।
    • Gary Marcus अक्सर ये दावा करते हैं कि AI वास्तविक दुनिया में काम ही नहीं करती—उनकी सही बातें लगभग chance level पर आती हैं।

    • यह पोस्ट इस पर है कि GPT‑5 ने क्या ओवरहाइप को justify किया और लोगों की प्रतिक्रिया क्या रही।

      • यह पूरी तरह legitimate विषय है।
      • और यह Gary Marcus का blog है, इसलिए opinion bias होना स्वाभाविक है; BBC article से अलग चीज़ है।
    • मुझे लग रहा है कि वास्तविक राय खोजना धीरे-धीरे कठिन होता जा रहा है।

      • ऑनलाइन ज्यादातर लोग दूसरों की राय को बस दोहराकर बोलते हैं, और ज़्यादा शोरगुल व उथला content चारों तरफ़ भरा है।
  • मेरे अनुभव में यह “upgrade” Plus users के लिए बड़े पैमाने पर downgrade है।

    • GPT‑5, O3 के मुकाबले response quality में कमजोर है; पर्याप्त सोच नहीं दिखती और O3 की तरह web search भी नहीं करता।

    • मैंने खुद ‘thinking’ चुना और clear निर्देश दिए, फिर भी issue solve नहीं होता।

    • अभी लगभग वही quality पाने के लिए Gemini पर जाना पड़ता है।

    • और custom GPTs (संबंधित जानकारी) भी खराब लग रहे हैं; मेरा custom grammar-checker GPT, मॉडल कुछ भी हो, निर्देश ignore कर देता है।

    • Deep research option भी अजीब है; चुनने पर भी वही जवाब देता है, निर्देश देने पर भी खास बदलाव नहीं।

    • Projects भी लगभग टूटे हुए लगते हैं।

      • निर्देश ठीक से नहीं मानता, कभी Spanish में उत्तर दे देता है या सवाल अनसुना कर देता है।
      • कभी-कभी लगता है कि जैसे वह खुद से ही बातचीत कर रहा हो; मैं कोई भी key दबाऊँ, वही unwanted जवाब बार-बार देता है, वो भी Spanish में।
    • शायद जानबूझकर free plan की तरफ push किया जा रहा है, या अगले साल शुरुआत से ads डालने की कोशिश होगी, या users को $200 वाले plan की तरफ ले जाने की चाल।

      • लगता है आगे बिना ads वाला $20 प्लान शायद हट जाएगा।
    • hallucinations (गलत जानकारी) वास्तव में बहुत ज़्यादा हैं।

      • बेहद निराशाजनक।
  • AI community को Gary Marcus जैसे independent experts की ज़रूरत है।

    • उद्योग से जुड़ी अतिशयोक्तियों या internal benchmark बदलावों (जैसे “हमने अंदर ही अंदर AGI पा लिया”) के पीछे भी सत्यता और transparency बनी रहनी चाहिए।

    • उनके style से अलग, Marcus ने scaling laws की सीमाओं या LLM प्रकार की AI में वास्तविक reasoning gap (distributional generalization) जैसी कई समस्याओं पर सही बिंदु पहले भी उठाए हैं।

    • इंडस्ट्री अक्सर शुरुआत में नकारती है, फिर समय के बाद नया concept (Prompt Chain, RL-based LLM आदि) बेचते हुए उसे खुद की खोज बताती है।

    • ओवरहाइप किए हुए narrative के बीच critical आवाज़ की ज़रूरत है।

      • LLM ecosystem में सबसे बड़ी आवाज़ें आमतौर पर आर्थिक लाभ वाले पक्ष की होती हैं।
      • मैं AI के खिलाफ नहीं हूँ, लेकिन यह माहौल कि यह तकनीक सभी आर्थिक घटनाओं से पूर्ण बेरोज़गारी लाएगी, बिल्कुल गलत है (अर्थव्यवस्था की वास्तविक कठिनाइयाँ अलग हैं, ज़्यादातर प्रत्येक देश की leadership से जुड़ी)।
      • अगर innovation की गति थोड़ी धीमी हो, तो कम से कम जिन products का मैं उपयोग करता हूँ वे मजबूरी में AI फीचर चिपकाने की बजाय वास्तविक features या bug fixes पर लौट सकें—यह मेरी अपेक्षा है।
    • मैं इससे strongly oppose करता हूँ।

      • यह essay लगभग Reddit शिकायत-पेस्ट जैसा है; इसमें सीधे टेस्ट परिणाम नहीं हैं, केवल लॉन्च प्रोसेस (500 मिलियन यूज़र्स के एक साथ rollout) की समस्याओं पर फोकस है।
      • ऐसी आलोचनाएँ GPT‑5 launch के मुख्य बिंदु मिस कर देती हैं; वास्तव में यह पहला ‘AI full product’ लॉन्च है और अब फोकस सिर्फ मॉडल सुधार नहीं, वास्तविक productization पर जा रहा है।
      • मुख्य बदलाव यह है कि यह पहले से तेज़, ज्यादा integrated, और incremental innovation (multimodal interaction, image generation आदि) के लिए संभव हुआ।
      • खासकर लंबा context और लंबे लक्ष्य को maintain करने की क्षमता में बड़ा jump है।
      • Willison ने भी कहा है कि वह इसे अपनी code workflow में इस्तेमाल करते हैं; मैं भी महसूस करता हूँ कि लंबी/जटिल coding tasks में यह Claude के साथ-साथ पुराने शीर्ष मॉडल (o3-pro, Gemini) से बेहतर है।
      • यह भी कि o3-pro की तुलना में coding speed कहीं ज़्यादा तेज़ है।
      • “Reddit users को 4o से attachment था इसलिए लॉन्च से नाराज़—oAI खत्म” जैसी analysis कमजोर और अर्थहीन है।
    • AI की अधिकतर सीमाओं या गलत समझ को Marcus से जोड़ना ठीक नहीं।

      • Marcus को कारण नहीं मानता।
  • अभी GPT को सच में जिस सबसे बड़े सुधार की जरूरत है, वह है “जब न पता हो तो साफ़ कह दो कि नहीं पता।”

    • आज मैंने Cyberpunk 2077 के एक mode में redscript से NPC auto-generate करने का तरीका खोजा; सच में कठिनाई से पता चला।

    • ChatGPT 5 ‘research’ कहता है लेकिन API गढ़ देता है, और कई बार तथ्य गलत है यह बताने पर भी सिर्फ hallucination दोहराता है।

    • 30 मिनट सिर्फ मेरा समय खराब हुआ; अगर वह सीधे कह देता कि उसे नहीं पता, तो 1 मिनट में हो जाता।

    • ChatGPT के बारे में ये assumption नहीं करनी चाहिए कि उसे सच में पता है।

      • यह केवल training data पर आधारित होकर statistical likelihood के आधार पर सबसे संभावित उत्तर देता है।
      • यह कोई internal ज्ञान प्रणाली refer नहीं करता, केवल language patterns output करता है।
      • किसी specific idea को propaganda की तरह बल देने के लिए training संभव है, पर सीधे fact reference नहीं कर सकता।
    • सही कहा।

      • क्योंकि यह पूरे भरोसे के साथ बोलता है और लगता है जैसे किसी निश्चित सहकर्मी की तरह, इसलिए बिना संदेह के भरोसा हो जाता है।
      • लेकिन सच में बहुत बार वह झूठ होता है, और यह वाकई irritate करने वाला है।
    • वास्तव में कुछ भी “जानता” नहीं।

      • सभी परिणाम लगभग prompt-based hallucination के करीब हैं।
    • “जब नहीं पता हो तो न जानते हुए कहना” सबसे ज़रूरी है—इससे सहमत।

      • Frontier AI labs के भीतर भी शायद इसकी बहुत review और experimentation हुई होगी।
      • शायद ये समस्या बार-बार दिखना इस बात का संकेत हो कि मॉडल की सीमा काफी स्पष्ट हो रही है।
    • ये सुधार वास्तव में चल रहे हैं; OpenAI की official जानकारी में इसका उल्लेख है।

      • संबंधित लिंक
      • GPT‑5 (‘thinking’ option) में ऐसे tasks के प्रति अधिक honest रहने की कोशिश है जो असंभव हों, जिनमें जानकारी कम हो, या जिनमें tool उपलब्ध न हो।
      • उदाहरण के लिए CharXiv multimodal benchmark में बिना image वाले prompt पर test करते समय, o3 ने non-existent image पर 86.7% confidence से निश्चित उत्तर दे दिया जबकि GPT‑5 केवल 9% पर आया।
      • impossible coding और multimodal assets की कमी वाली स्थिति में भी GPT‑5 reasoning, o3 की तुलना में काफी कम गलतियाँ करता है।
      • वास्तविक ChatGPT traffic-based लंबी conversation सेट में deception ratio को 4.8% से घटाकर 2.1% किया गया।
      • अभी और सुधार चाहिए; research अभी चल रही है—system card देखें।
  • मुझे लगता है कि उसकी “perfect-match obsession” वास्तविक fact को ही धुंधला कर देती है।

    • hybrid symbolic/transformer सिस्टम पर discussion रोचक है।

    • linked post में दिखाया कि गणित को Python को delegate करके Grok 4 गणित में सफल हो सका।

    • personally मैं symbolic-first approach देखना चाहूँगा: वास्तविक hard math के लिए symbolic तरीका, और सिर्फ reasoning-requiring areas को monad से handle करना।

    • Aloe की neuro-symbolic system ने OpenAI के deep research GAIA benchmark में लगभग 20 points का अंतर बनाते हुए आगे जगह बनाई।

      • Gary निश्चित रूप से ज्यादा बोलते और कभी-कभी ओवरस्टेट करते हैं, लेकिन LLM limits को लेकर वह सच में समझदार हैं (aloe.inc)
  • GPT‑5 में एक अलग समस्या दिखी जो GPT‑4 में नहीं थी।

    • चैट थ्रेड में context अचानक टूट जाता है और अगला जवाब ठीक से समझ नहीं पाता।

    • लगता है जैसे किसी context-cleanup process का हस्तक्षेप हो रहा है—जबकि अब तक की बातचीत का summary नहीं करके आगे बढ़ जाता है।

    • शायद वास्तविक usable context बहुत छोटा हो गया है; यह स्थिति बार-बार हो रही है।

    • अगर कहूँ कि “हाल की बातचीत review करो” तो थोड़ा बेहतर लगता है।

    • मेरे केस में जवाब काफी छोटे हो गए हैं।

  • “लोग चमत्कार की उम्मीद कर बैठे थे, लेकिन GPT‑5 सिर्फ नया incremental upgrade है।”

    • शायद इस लेख में उपयोगी यही एक लाइन थी।
    • लोगों को incremental progress ही अपेक्षित करना चाहिए।
    • providers को miracles वादा नहीं करना चाहिए।
    • expectation management बहुत महत्वपूर्ण है।
    • incremental progress भी निश्चित तौर पर progress है।
    • बस “AGI आगे जाकर हमेशा GPT series के बाद के चरणों में आएगा” जैसी लाइन से सहमत नहीं।
  • अब training data लगभग खत्म होने वाली चीज़ है।

    • AI में आगे के सारे सुधार अब structural/architectural बदलाव पर निर्भर होंगे।

    • सभी नए मॉडल नए information पर local maxima पर टिक जाते हैं।

    • पहले के शोध बताते हैं कि deliberately collected वास्तविक data और मुख्यतः synthetic data को मिलाकर frontier LLM training करना सबसे प्रभावी है।

    • मैंने यही बात दो साल पहले भी इसी context में कही थी।

      • high-quality content लूटने लायक कोई ‘second internet’ नहीं है।
      • existing information भी धीरे-धीरे ज्यादा बंद होने लगी है।
    • क्या सच में GPT‑5 पहले ही दुनिया का सारा वीडियो डेटा सीख चुका है?

    • नया training data रोज़ नहीं बनता क्या?

      • YouTube, Facebook, TikTok आदि।
      • इंसान एक content creation machine हैं।
  • OpenAI चाहे best model बना दे, ‘GPT‑5’ नाम पर community और OpenAI ने पहले ही hype चढ़ा दिया है, जिससे failure जैसे पहले ही तय हो गया है।

    • शायद OpenAI को memes और ओवरहाइप से बचते हुए gradual सुधार चुनना चाहिए था, पर उससे investors, narrative और AI ecosystem टिकाना कठिन होता।

    • हमें शायद पहले ही peak पर पहुँच चुके हैं।

    • यह भी सच है कि Sam Altman ने सीधे वही अपेक्षा create की और उसे push किया।

    • अगर वास्तविक AGI आ भी जाए तो यह देखने में दिलचस्प होगा कि लोग कैसे “फेल हो गया, अपेक्षा के नीचे रहा” वाली logic चलाएँगे।