4 पॉइंट द्वारा GN⁺ 2026-02-05 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • GPT-5.2 और GPT-5.2-Codex मॉडल की प्रोसेसिंग स्पीड पहले की तुलना में 40% बेहतर हुई
  • सभी API उपयोगकर्ताओं के लिए inference stack को optimize किया गया
  • वही मॉडल और वही weights, लेकिन कम latency हासिल की गई

1 टिप्पणियां

 
GN⁺ 2026-02-05
Hacker News की राय
  • पिछले एक महीने में OpenAI ने Codex users के लिए कई फीचर जारी किए हैं

    • subagents support
    • बेहतर multi-agent interface (Codex app)
    • 40% तेज़ reasoning speed
      सिर्फ पहले दो फीचर्स से ही productivity लगभग 3 गुना बढ़ी हुई महसूस हुई। इस अपडेट का सच में इंतज़ार है
    • जानना चाहूँगा कि subagents कैसे काम करते हैं
    • यह API-only feature है
    • Claude को इस्तेमाल करने पर performance x² स्तर तक बेहतर हो जाती है। लगता है OpenAI भी दबाव में होगा
  • वीकेंड के दौरान मैंने वही prompt GPT-5.2, Gemini 3, Grok पर चलाकर देखा
    Gemini 3 और Grok ने ‘thinking mode’ में 2 मिनट के अंदर खत्म कर दिया, लेकिन GPT-5.2 6 मिनट तक वहीं अटका रहा

  • हाल ही में पता चला कि roon ने यह नोटिस किया कि employee accounts आम users से कहीं तेज़ हैं
    इसलिए उसे समझ आया कि internal API calls को आम users की तुलना में ज़्यादा efficient तरीके से चलाया जा सकता है
    आखिरकार आम users का काम बस बची हुई capacity पर ही हो रहा है
    संबंधित लेख: Choose Your Fighter (The Zvi)

  • मेरे हिसाब से OpenAI की आदत है कि मॉडल लॉन्च करने के बाद जानबूझकर quality कम कर देता है
    ChatGPT 5.2 web version शुरुआत में काफी बेहतर था, लेकिन 1–2 हफ्तों बाद अचानक quality गिर गई
    यह मीडिया और benchmarks को गुमराह करने वाली रणनीति जैसा लगा
    speed बढ़ाने के लिए बस reasoning intensity कम करनी पड़ती है, इसलिए 40% सुधार वाली बात पर भरोसा करना मुश्किल है
    यह भी कोई ‘ट्रिक’ हो सकती है, जैसे पहले ChatGPT Plus users को Pro model देना और बाद में Standard पर बदल देना

    • यह शक समझ में आता है, लेकिन हम ऐसी धोखाधड़ी नहीं करते
      हम model quality को स्थिर रखते हैं, और performance गिरने की रिपोर्ट मिलते ही तुरंत जांच करते हैं
      इस बार speed improvement token-per-token processing time में सुधार की वजह से है, model quality या weights में कोई बदलाव नहीं है
    • सिर्फ OpenAI ही नहीं। Anthropic के साथ भी ऐसे मिलते-जुलते मामले रहे हैं
      संदर्भ: Claude Code Tracker (MarginLab)
    • Codex के लिए daily benchmark site बनाना अच्छा रहेगा
    • आप खुद benchmark दोबारा चलाकर देख सकते हैं
  • दिलचस्प बात यह है कि Cerebras पर inference cost काफी महंगी होने के बावजूद कीमत वही रखी गई है

    • लेकिन संभव है कि यह Cerebras न हो।
      अगर यह Cerebras होता, तो model behavior अलग होता और speed लगभग 10 गुना तेज़ होती
      शायद उन्होंने Blackwell series के लिए optimized kernel नया लिखा है
    • लगभग पक्का है कि यह Cerebras पर नहीं चल रहा
  • speed हमेशा सबसे बड़ी शिकायत थी, लेकिन इस सुधार के बाद इसे फिर से आज़माने का मन हो रहा है

  • जानना चाहूँगा कि उन्होंने यह speed improvement कैसे हासिल किया

  • Reddit पर भी quality गिरने को लेकर बहुत पोस्ट हैं

    • लेकिन Reddit पर हर दिन ऐसे पोस्ट आते हैं।
      Claude से जुड़े subreddits में भी यही होता है, और विश्वसनीय सबूत लगभग नहीं होते