गूगल की तेजी के बीच ChatGPT सुधार के लिए OpenAI ने 'कोड रेड' लागू किया

(theverge.com)

2 पॉइंट द्वारा GN⁺ 2025-12-03 | 3 टिप्पणियां | WhatsApp पर शेयर करें

OpenAI ने ChatGPT की गुणवत्ता सुधारने के लिए ‘कोड रेड’ स्तर पर तुरंत आपात मोड में शिफ्ट होकर, गूगल की तेजी से बढ़ती चुनौती से डगमगाई हुई अपनी बढ़त वापस पाने की कोशिश शुरू की है
अभी व्यक्तिकरण, गति, विश्वसनीयता और जवाब देने योग्य प्रश्नों के दायरे के विस्तार जैसी प्रमुख क्षमताओं को तुरंत मजबूत करना जरूरी है, इसलिए विज्ञापन, Pulse (व्यक्तिगत सहायक), हेल्थ और शॉपिंग एजेंट जैसे सभी नए प्रोजेक्ट रोक दिए गए हैं या टाल दिए गए हैं
Google का Gemini 3 हालिया कई बेंचमार्क में OpenAI मॉडल्स से आगे रहा है, और इमेज मॉडल Nano Banana की सफलता से MAU 45 करोड़ से बढ़कर 65 करोड़ तक तेज़ी से उछला, जो बड़ा खतरा बनकर सामने आया
OpenAI पर हजारों करोड़ डॉलर के डेटा-सेंटर निवेश अनुबंध और 2030 तक लगभग 200 अरब डॉलर के वार्षिक राजस्व की जरूरत जैसी वित्तीय दबावों का बोझ बढ़ रहा है, जबकि Anthropic की एंटरप्राइज़ ग्राहक वृद्धि भी प्रतिस्पर्धा का एक बड़ा कारण बन रही है
OpenAI ने रोज़ाना रिव्यू सिस्टम सक्रिय कर टीमों का पुनर्नियोजन शुरू किया है, और आंतरिक तौर पर यह भी कहा है कि जल्द सार्वजनिक होगा नया reasoning मॉडल Google के नवीनतम संस्करण से आगे है—इससे नेतृत्व वापस पाने का रास्ता निर्णायक बन गया है

कोड रेड का सक्रियण और ChatGPT सुधार योजना

OpenAI में आंतरिक मेमो से पता चला कि ChatGPT की समस्याओं को हल करने के लिए कंपनी ने सबसे ऊँचे चरण ‘कोड रेड’ का आपातकालीन मोड शुरू किया
- OpenAI में yellow → orange → red की 3-स्तरीय अलर्ट प्रणाली है, और यह कदम पहले चल रहे कोड ऑरेंज से एक स्तर ऊपर है
सुधार का दायरा व्यक्तिकरण बढ़ाने, जवाब की गति बेहतर करने, सर्वर की विश्वसनीयता सुधारने और उत्तर दिए जाने वाले प्रश्नों के दायरे का विस्तार जैसे उपयोगकर्ता अनुभव के सभी पहलुओं को कवर करता है
इसी के कारण विज्ञापन, Pulse (पर्सनल असिस्टेंट), हेल्थ/शॉपिंग एजेंट जैसे सभी नए प्रोजेक्ट फिलहाल स्थगित या पीछे धकेल दिए गए हैं
- कंपनी ने संगठनभर में टीम पुनर्गठन को बढ़ावा देने और दैनिक विकास स्थिति की समीक्षा करने वाली डेडिकेटेड कॉल (daily call) चलाने का निर्णय लिया है
हाल में GPT-5 पर ठंडा टोन, बेसिक प्रश्नों की गलतियाँ जैसी शिकायतें आई थीं, और इसमें मॉडल के टोन और निर्देश पालन क्षमता को फिर से ट्यून करने की कोशिश भी शामिल है

Google Gemini का पीछा और प्रतिस्पर्धी दबाव

Google के नए Gemini 3 मॉडल ने कई इंडस्ट्री बेंचमार्क में OpenAI को पीछे छोड़ दिया, जिससे प्रतिस्पर्धा का संतुलन काफी हद तक हिल गया है
- Gemini की घोषणा के तुरंत बाद Google का शेयर बढ़ा और उसका प्रदर्शन बाज़ार में तेज़ी से चर्चा में आया
इमेज जनरेशन मॉडल Nano Banana के अगस्त में लॉन्च के बाद, Google AI का कुल मासिक सक्रिय उपयोगकर्ता (MAU)
- जुलाई में MAU 45 करोड़ से बढ़कर अक्टूबर में 65 करोड़ तक पहुंचा
Anthropic भी एंटरप्राइज़ ग्राहक आधार पर फैल रही है, जिससे OpenAI की एकल बढ़त कमज़ोर होने की प्रवृत्ति दिख रही है
ChatGPT लॉन्च के तुरंत बाद Google द्वारा की गई ‘कोड रेड’ अब विडंबना के तौर पर OpenAI पर लौटे हुए रूप में वर्णित की गई

निवेश, वित्तीय दबाव और बाजार की चिंता

OpenAI ने Microsoft और Amazon के साथ अनुबंध करके 36GW के पैमाने का डेटा-सेंटर बिजली अनुबंध किया है,
- आगे चलकर वार्षिक 620 अरब डॉलर के आसपास डेटा-सेंटर किराया खर्च आ सकता है
2030 तक लाभदायक होने के लिए लगभग 200 अरब डॉलर की सालाना राजस्व आवश्यकता का भी आंतरिक अनुमान है
OpenAI के पास अभी लिस्टिंग प्लान नहीं है,
- लेकिन यह वित्तीय ढांचा Nvidia, Oracle, Microsoft जैसी प्रमुख टेक कंपनियों के शेयरों से गहरे जुड़ा होने के कारण पूरे मार्केट को प्रभावित कर रहा है
OpenAI अभी भी घाटे में है, और लगातार बड़े पैमाने पर फंडिंग न मिलने पर इसकी टिकाऊ मौजूदगी कठिन मानी जा रही है

नया मॉडल

Altman ने मेमो में कहा कि अगले हफ्ते आने वाला नया reasoning मॉडल Google Gemini के नवीनतम संस्करण से आगे है
- इसे टीम का उत्साह बढ़ाने वाला कदम और ChatGPT की growth तथा नेतृत्व वापसी के संकल्प को दोहराने वाला संकेत माना गया
ChatGPT अभी भी साप्ताहिक 80 करोड़ से अधिक यूज़र्स रखता है,
- OpenAI इसमें फिर से गति, सटीकता और व्यक्तिगत अनुभव जोड़कर वृद्धि बनी रहने की योजना बना रहा है

समग्र परिप्रेक्ष्य

प्रतिस्पर्धा तेज़ होने (Google/Anthropic), उत्पाद की गुणवत्ता विवाद और विशाल इंफ्रास्ट्रक्चर लागत के इस मेल में,
ChatGPT की मूल क्वालिटी वापस लाना OpenAI की अस्तित्व रणनीति और सबसे तात्कालिक प्राथमिकता बनकर सामने आता है

3 टिप्पणियां

slowandsnow 2025-12-04

chatgpt की समस्याएँ
बग बहुत ज़्यादा हैं। Send दबाने पर कभी message generate ही नहीं होता, या message streaming के दौरान error आकर सब कुछ गायब हो जाता है, वगैरह। Deep Research में सोचने वाले mode से भी कम sources मिलते हैं। अब Deep Research इस्तेमाल करने की वजह ही नहीं बची।
codex की समस्याएँ
बहुत धीमा है। Claude Code में जो काम 5 मिनट में हो जाता है, वही Codex में 10 मिनट से ज़्यादा लेता है। बहुत बेवकूफ़ है

yinn27 2025-12-04

लेकिन Gemini का UI वगैरह, और कुल मिलाकर, ChatGPT की तुलना में इस्तेमाल करने में ज़्यादा असुविधाजनक नहीं है..?

GN⁺ 2025-12-03

Hacker News राय

पिछले हफ्ते एक ग्राहक ने मेरे द्वारा आंशिक रूप से लिखी गई एक फीचर के बारे में पूछताछ भेजी। सपोर्ट इंजीनियर ने Claude के ज़रिए जवाब बनाया, लेकिन उसने आंतरिक और सार्वजनिक दस्तावेज़ों पर ट्रेनिंग होने के बावजूद बेहद आत्मविश्वास के साथ विश्वसनीय बकवास पैदा कर दी
जब मैं समझा रहा था कि वह क्यों गलत है, तो एक दूसरे इंजीनियर ने उसे Augment में चलाया, और इस बार उसने फिर एक अलग तरह की बकवास पूरे आत्मविश्वास से दे दी। अंत में हमने सिर्फ रोने वाले इमोजी ही साझा किए, और मैं आगे भी अपनी खुद की बुद्धि का इस्तेमाल करूंगा
- मेरा कोड 0.11 सेकंड लेता है, Gemini का कोड 0.5 सेकंड। बॉस पूछ रहा है क्यों, और मुझे समझ नहीं आ रहा कि क्या बताऊँ ¯\(ツ)/¯
- LLMs असंभव कामों में वाकई बहुत कमजोर हैं। कभी-कभी तो इनके hallucination से गढ़े गए फीचर को सच में इम्प्लीमेंट कर देना बेहतर लगता है। कुछ public API providers पहले से ऐसा कर भी रहे हैं
मैंने अफवाह सुनी है कि OpenAI 2024 के मध्य के बाद से सफल pre-training नहीं कर पाया है। अगर आप ChatGPT 5.1 से इंटरनेट के बिना मौजूदा घटनाओं के बारे में पूछें, तो वह कहता है कि उसका knowledge cutoff जून 2024 है। पता नहीं यह छोटे मॉडल की वजह से है या नहीं, लेकिन इस समय 18 महीने पुराना cutoff होना चिंताजनक संकेत लगता है
- SemiAnalysis न्यूज़लेटर में भी यही बात आई थी, और इसका कभी खंडन नहीं किया गया
- जब-तब GPT models से coding कर के देखो, तो संक्षिप्त conversational style की वजह से कुछ दिन तक अच्छा लगता है। लेकिन आखिर में गुणवत्ता Claude या Gemini से कम निकलती है और failure patterns भी ज़्यादा होते हैं
- मैंने ChatGPT 5.1 से codex CLI installation issue के बारे में पूछा, तो उसने पूरे आत्मविश्वास से कहा कि codex बंद हो चुका है और मैंने ‘openai’ कमांड गलत इस्तेमाल की है
- Google ने भी 2000 के शुरुआती दशक में web crawling delays झेले थे, फिर भी बच गया। लेकिन आज का OpenAI उस समय के Google जितनी differentiated position में नहीं है, इसलिए स्थिति कहीं ज़्यादा जोखिम भरी हो सकती है
- मैंने पूछा कि Indiana Jones PS5 पर खेलूँ या PC पर, तो पहले उसने इसे typo समझा, फिर इंटरनेट पर खोजकर आया और मेरी gaming rig की तारीफ करने लगा
ऐसा लग रहा है कि पिछले साल से जारी OpenAI के मुख्य शोधकर्ताओं का पलायन अब सच में असर दिखाने लगा है। Sam Altman एक salesman हैं, researcher नहीं। Ilya भी नहीं हैं, और अहम लोग Google·Meta·Anthropic चले गए या अपनी कंपनी शुरू कर चुके हैं। जो लोग बचे हैं वे iterative improvement में अच्छे हो सकते हैं, लेकिन क्या वे खुद अगली बड़ी छलांग का नेतृत्व कर पाएंगे, यह संदिग्ध है
आज का OpenAI कुछ-कुछ Netscape जैसा है। नवाचारी है, लेकिन टिकाऊ revenue model नहीं है। एक तरफ Google की तरह मौजूदा products में AI को मुफ्त bundle किया जा रहा है, और दूसरी तरफ Deepseek या Qwen open source बनकर कीमतें गिरा रहे हैं। यानी दोनों तरफ से दबाव है
- कहा जा रहा है कि OpenAI इस साल 20 अरब डॉलर annual revenue पार कर जाएगा (CNBC लेख)
- अगर OpenAI commercialize करने में विफल होकर फिर non-profit model में लौटे और मुफ्त tools साझा करे, तो वह Mozilla का रास्ता चलेगा
- लोग कहते हैं, “Google Gemini को मुफ्त bundle करेगा,” लेकिन मुझे तो लगता है वह पहले से लगभग हर product में यही कर रहा है
- मेरी पत्नी Claude पर स्विच करने से मना करती है। उसे लगता है कि ChatGPT उसकी पसंद के हिसाब से पूरी तरह tuned है
- Gemini को मुफ्त bundle करने के लिए Flash 3.0 की inference cost को 2.5 से बहुत नीचे लाना पड़ेगा
मैं सच में जानना चाहता हूँ: OpenAI pre-training में कैसे fail हो सकता है? उनके पास पहले से सफलता का अनुभव है, बेहतरीन लोग हैं, तो क्या वे बस 2024 मॉडल को फिर से train नहीं कर सकते?
- वही वजह जिससे हर कोई fail होता है। hyperparameters को नए hardware के लिए tune किया जाता है, papers में देखे गए improvements जोड़े जाते हैं, और महीनों व लाखों डॉलर के बाद loss flatten हो जाता है और नतीजा मामूली निकलता है
- अगर ‘successful’ का मतलब पिछले मॉडल से स्पष्ट रूप से बेहतर performance है, तो वह वाकई बहुत कठिन काम है
- मैंने सुना है GPT-4.5 ऐसी ही एक कोशिश थी। बस performance पर्याप्त नहीं थी, इसलिए रिलीज़ नहीं किया गया
- नया मॉडल पुराने मॉडल की training को आगे बढ़ाकर नहीं बनता। architecture पूरी तरह अलग होती है। हो सकता है इस बार वही design mid-2024 मॉडल से भी बदतर निकला हो
मेरे अनुभव में “Code Red” आम तौर पर कंपनी-भर के दिशाहीन हो जाने को पैकेज करके पेश करने वाला शब्द रहा है। middle management को समझ नहीं आता कि क्या करना है, और आख़िर में बोझ engineers पर आ गिरता है
- PMs और middle managers को निकाल देने से ऐसी स्थिति नहीं रुकती। यह बड़े संगठनों की decision-making structure को बहुत सरल मानने वाली सोच है
- अगर Code Red सही मायनों में हो, तो कंपनी की priorities को एक करना चाहिए और engineers को core projects पर फिर से तैनात करना चाहिए
- मैंने जो एकमात्र उदाहरण देखा, उसमें सच में PMs को निकाला गया था, लेकिन फिर अप्रत्याशित समस्याएँ फूट पड़ीं, और उसे इस सोच के साथ स्वीकार किया गया कि “अच्छा है, कम से कम समस्याओं का पता तो चला”
- “हर समस्या किसी और की गलती है, और अगर सिर्फ मैं रह जाऊँ तो सब ठीक हो जाएगा” — यह engineer का भ्रम भी मौजूद है
- यह Code Red monetization features रोकने का बहाना भी हो सकता है। यानी वास्तविक corporate valuation से फासले को टालने की कोशिश
असली Code Red यह नहीं है कि Google, OpenAI से आगे निकल गया, बल्कि यह है कि AI industry में कोई moat नहीं है। आखिरकार सब लोग सबसे महँगी race to the bottom में फँसे हुए हैं
- ऐसी कंपनियाँ अंत में government contracts या परोक्ष bailout के ज़रिए अपने नुकसान को समाज पर डाल देंगी
- यह स्पष्ट नहीं है कि Gemini 3 की performance ने सच में ChatGPT users को दूर किया है या नहीं
- मुझे समझ नहीं आता कि investors घाटे वाली commoditized competition को लेकर इतने उत्साहित क्यों हैं। मैं भी GPT3~4 दौर में fan था, लेकिन अब Claude और Gemini दोनों साथ इस्तेमाल करता हूँ। loyalty शून्य है
- अगर ऐसा है, तो फिर Google का stock Gemini 2.5 Pro के बाद इतना क्यों उछला?
- मुझे भी लगा था कि OpenAI के पास कोई गुप्त training technique होगी, लेकिन ऐसा कुछ नहीं निकला
OpenAI ने Stargate project आदि के ज़रिए 500 अरब डॉलर के दीर्घकालिक खर्च का वादा कर रखा है। Microsoft Azure पर 250 अरब डॉलर, और AMD GPUs पर भी कई अरब डॉलर खर्च होने हैं। Oracle ने इसके लिए 18 अरब डॉलर के bonds और 9.6 अरब डॉलर के loans लिए हैं
अगर OpenAI पीछे रह गया, तो वह इन contracts को संभाल नहीं पाएगा, और chain-default risk पैदा हो सकता है। सरकारी दखल की संभावना भी है
- Altman कहते हैं bailout नहीं होगा, लेकिन यही बात भरोसा दिलाने की रणनीति भी हो सकती है
- 500 अरब डॉलर spending commitment है, revenue नहीं। यह बहुत बड़ा फर्क है
- बेहतर होगा कि Congress gridlock ऐसी bailout को रोक दे
- ज़्यादातर तो non-binding LOI हैं, इसलिए वे उतने पक्के वादे नहीं हैं जितने दिखते हैं
- हो सकता है LLM architecture से AGI तक पहुँचना संभव ही न हो। अगर कोई वैकल्पिक architecture नहीं बना, तो ये सारे contracts बेकार हो जाएंगे
कहा जा रहा है कि OpenAI ads·shopping·health agents·Pulse जैसे projects को टालकर ChatGPT सुधार पर ध्यान दे रहा है, लेकिन मूल बात यह है कि मुख्य प्रतिभा तो गिने-चुने लोगों में होती है, बाकी लोग ads या commercial features पर काम कर सकते हैं। दोनों में ज़रूरी नहीं कि टकराव हो
- bottleneck लोग नहीं, बल्कि leadership की strategic thinking capacity हो सकती है
- समस्या product quality नहीं, बल्कि ecosystem बनाने की क्षमता भी हो सकती है। Google पहले से रोज़मर्रा के tools में integrated है
- LLM प्रगति दो स्तरों पर बँटी है: ① low-level architecture ② application·verification systems। दूसरा हिस्सा automated verification data generation के ज़रिए core model सुधार में योगदान देता है
- ‘delay’ का मतलब पूरी तरह रोकना नहीं, बल्कि computing resources का पुनर्वितरण भी हो सकता है
- consumer के नज़रिए से उम्मीद है कि ऐसी competition model quality improvement तक ले जाए
WSJ के मुताबिक OpenAI ads, health·shopping AI, personal assistant Pulse आदि को टाल रहा है। Jony Ive के साथ hardware collaboration तक देखें, तो focus बिखरा हुआ लगता है
- इसके अलावा social network या browser जैसे projects की भी घोषणा की गई थी
- Google से प्रतिस्पर्धा करनी है, तो ad market में प्रवेश सबसे अहम है। वरना ad budget Meta·Amazon·Google की ओर बहता रहेगा
- आखिरकार ads और Siri/Alexa-शैली assistant ही केंद्र में हैं, इसलिए उन्हें टालना अजीब है
- यह सिर्फ focus खोने की बात नहीं, बल्कि अब यह short-term results चलाने वाली कंपनी बन चुकी है। Google जैसा प्रतिद्वंद्वी 25 साल से यह खेल खेल रहा है। सिर्फ hardware विस्तार से उसे हराना मुश्किल है
- असल में यह Google से competition की नहीं, बल्कि ads के OpenAI के survival test बनने की बात है।
  अगर ads से पैसा बनता है, तो OpenAI Mag 7-स्तर की कंपनी बन सकता है; अगर नहीं, तो हकीकत सामने आ जाएगी।
  अगर ad experiments के नतीजे पहले से उम्मीद से कम हैं, तो ‘Code Red’ शायद उसे ढकने के लिए समय खरीदने वाला संकेत भी हो सकता है।
  ChatGPT, Google की तरह search entry point नहीं है, और Meta की तरह feed-based ads भी नहीं कर सकता।
  आखिर में Alexa की विफलता दोहरने की संभावना काफ़ी है.