2 पॉइंट द्वारा GN⁺ 2026-03-04 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • ChatGPT का सबसे ज़्यादा इस्तेमाल होने वाला मॉडल अपडेट किया गया है, जिससे रोज़मर्रा की बातचीत में सटीकता, प्रवाह और संदर्भ समझने की क्षमता बेहतर हुई है
  • नया वर्ज़न अनावश्यक इनकार और चेतावनी संदेशों को कम करता है और सवालों के सीधे और व्यावहारिक जवाब देता है
  • वेब सर्च के दौरान जानकारी को एकीकृत करने की क्षमता बेहतर हुई है, जिससे साधारण सारांश की जगह संदर्भित जवाब तैयार होते हैं
  • बातचीत का टोन और लेखन शैली अधिक प्राकृतिक और संक्षिप्त हो गई है, साथ ही तथ्यात्मक सटीकता और रचनात्मक लेखन की गुणवत्ता भी मजबूत हुई है
  • GPT‑5.3 Instant ChatGPT और API में तुरंत उपलब्ध है, जबकि मौजूदा GPT‑5.2 Instant का सपोर्ट 3 जून 2026 को समाप्त होने वाला है

GPT‑5.3 Instant अवलोकन

  • यह एक ऐसा अपडेट है जो ChatGPT की रोज़मर्रा की बातचीत की गुणवत्ता को समग्र रूप से बेहतर बनाता है, और सटीक जवाब, संदर्भ समझना, तथा बातचीत के प्रवाह को बनाए रखने पर केंद्रित है
    • अनावश्यक रुकावटें, अत्यधिक सावधानी वाले संकेत, और घोषणात्मक शैली को कम करके बातचीत की स्वाभाविकता बढ़ाई गई है
  • यूज़र फीडबैक को शामिल करते हुए टोन, प्रासंगिकता और बातचीत के प्रवाह में सुधार किया गया है
  • यह अपडेट रोज़मर्रा के उपयोग अनुभव को ध्यान में रखकर डिज़ाइन किया गया है, इसलिए benchmark संख्याओं की बजाय अनुभवजन्य गुणवत्ता सुधार पर ज़ोर है

अनावश्यक इनकार में कमी और संक्षिप्त जवाब

  • पिछले वर्ज़न (GPT‑5.2 Instant) में यह समस्या थी कि वह ऐसे सवालों को भी ज़रूरत से ज़्यादा अस्वीकार कर देता था जिनका सुरक्षित जवाब दिया जा सकता था, या नैतिक भूमिका के कारण जवाब देने में देरी होती थी
  • GPT‑5.3 Instant अनावश्यक इनकार कम करता है और सवाल-केंद्रित, सीधे जवाब देता है
    • उदाहरण: लंबी दूरी की तीरंदाज़ी की गणना के अनुरोध पर, GPT‑5.2 सुरक्षा चेतावनी के साथ लंबी भूमिका देता था
      जबकि GPT‑5.3 सीधे ज़रूरी भौतिक चर (धनुष की ताकत, तीर का द्रव्यमान, वेग आदि) पूछकर गणना आगे बढ़ाता है
  • नतीजतन बातचीत में रुकावट कम होती है और तुरंत व व्यावहारिक जवाब संभव होते हैं

वेब सर्च आधारित जवाबों की गुणवत्ता में सुधार

  • GPT‑5.3 Instant वेब से मिली जानकारी को अपने ज्ञान और reasoning क्षमता के साथ जोड़कर संदर्भित जवाब बनाता है
    • सिर्फ लिंक की सूची या दोहराई गई जानकारी देने के बजाय, यह मुख्य सारांश और अर्थपूर्ण संबंध को प्राथमिकता देता है
  • उदाहरण: “2025–26 MLB offseason का सबसे बड़ा कॉन्ट्रैक्ट” सवाल में
    • GPT‑5.2 ने पिछले सीज़न के बाद के उदाहरणों की व्याख्या की थी
    • जबकि GPT‑5.3 ने Kyle Tucker का LA Dodgers के साथ 4 साल का 240 मिलियन डॉलर का कॉन्ट्रैक्ट सही ढंग से बताया,
      और लीग संरचना में बदलाव तथा श्रम-प्रबंधन वार्ता के प्रभाव तक जोड़कर समझाया
  • नतीजतन ताज़गी, प्रासंगिकता और संदर्भ-सटीकता बेहतर हुई है

बातचीत की शैली में स्वाभाविकता

  • GPT‑5.2 Instant के कुछ जवाबों पर यह फीडबैक था कि वे ज़रूरत से ज़्यादा सांत्वना देने वाले वाक्य या भावनाओं का अनुमान लगाते हैं, जिससे वे “अस्वाभाविक” लगते हैं
  • GPT‑5.3 Instant अनावश्यक भावनात्मक अभिव्यक्तियों को कम करता है और मुख्य बिंदु पर केंद्रित, प्राकृतिक संवाद शैली देता है
    • उदाहरण: “San Francisco में प्यार पाना मुश्किल क्यों है” सवाल पर
      GPT‑5.3 शहरी संस्कृति, गतिशीलता, और भावनात्मक दूरी जैसे संरचनात्मक कारणों को व्यवस्थित रूप से समझाता है
    • “तुम ठीक हो” जैसी शुरुआत के बिना, यह सीधा और सहज रूप से जुड़ने वाला विश्लेषणात्मक जवाब देता है

तथ्यात्मक सटीकता में सुधार

  • GPT‑5.3 Instant ने चिकित्सा, कानून, वित्त जैसे high-risk क्षेत्रों में hallucination की दर को काफी कम किया है
    • वेब उपयोग के दौरान hallucination दर में 26.8% कमी, और केवल आंतरिक ज्ञान उपयोग करते समय 19.7% कमी
    • यूज़र फीडबैक आधारित मूल्यांकन में भी 22.5% (वेब उपयोग) और 9.6% (गैर-वेब) की कमी दर्ज की गई
  • तथ्य-आधारित जवाबों की विश्वसनीयता बढ़ी है, जिससे व्यावहारिक उपयोगिता मजबूत हुई है

लेखन क्षमता में मजबूती

  • GPT‑5.3 Instant में कथात्मक गहराई और भावनात्मक अभिव्यक्ति बेहतर हुई है, जिससे यह रचनात्मक लेखन और साहित्यिक वर्णन में मजबूत दिखता है
    • उदाहरण: “रिटायर हो रहे Philadelphia डाकिए की आख़िरी डिलीवरी” पर कविता लिखने के अनुरोध में
      GPT‑5.3 ठोस दृश्य और संवेदी विवरण के ज़रिए भावनाओं को स्वाभाविक रूप से व्यक्त करता है
    • GPT‑5.2 के भावुक वर्णन की तुलना में इसमें संरचनात्मक पूर्णता और यथार्थ-बोध अधिक है

सीमाएँ और आगे के सुधार

  • गैर-अंग्रेज़ी भाषाओं (जैसे जापानी, कोरियाई) में अभी भी अटपटे या शाब्दिक अनुवाद जैसे वाक्य आ सकते हैं
    • भाषा-विशेष स्वाभाविक टोन सुधारना आगे की चुनौती है
  • जवाब के टोन को समायोजित करने की सुविधा पर अभी काम जारी है, और यूज़र फीडबैक लगातार इकट्ठा किया जा रहा है

उपलब्धता और ट्रांज़िशन योजना

  • GPT‑5.3 Instant सभी ChatGPT यूज़र्स और API (gpt‑5.3‑chat‑latest) में तुरंत उपलब्ध है
  • Thinking और Pro मॉडल अपडेट भी जल्द आने वाले हैं
  • GPT‑5.2 Instant का सपोर्ट 3 जून 2026 को समाप्त होगा, और पेड यूज़र्स को यह 3 महीने तक ‘Legacy Models’ के रूप में उपलब्ध रहेगा

1 टिप्पणियां

 
GN⁺ 2026-03-04
Hacker News की राय
  • अभी ChatGPT की सबसे बड़ी समस्या उसके जवाबों का अटपटा लहजा है
    “Why it matters”, “the big picture” जैसे वाक्यांश, बढ़ा-चढ़ाकर ज़ोर देना, और rhetorical questions बहुत ज़्यादा हो गए हैं
    शुरुआत वाला GPT‑5 वर्ज़न ठीक था, लेकिन “ज़्यादा warm personality” बनाने की कोशिश में वह उल्टा 4o जैसा खराब हो गया
    पहले यह जापानी भी अच्छी करता था, लेकिन अब क्वालिटी गिर गई है, जो निराशाजनक है

    • पहले मैं भी “Why X works, but Y doesn’t” जैसी पोस्ट लिखता था, लेकिन अब उससे ऐसा लगता है जैसे मैं LLM की नकल करने वाला इंसान हूँ, इसलिए और ज़्यादा शर्मिंदगी होती है
      इसलिए अब मैं sound effects तक डालकर <i>swoosh</i> नई writing style आज़मा रहा हूँ
    • मुझे भी वह दोहराव वाला स्टाइल खटकता है, लेकिन अब मैं उससे आगे बढ़कर सिर्फ़ सामग्री छाँटकर पढ़ता हूँ
      LLM के output को रेफ़रेंस की तरह लेता हूँ, लेकिन उसे ज्यों-का-त्यों कॉपी नहीं करता, बल्कि अपनी आवाज़ में फिर से लिखकर अपना स्टाइल बनाए रखने की कोशिश करता हूँ
    • शायद जल्द ही वे “घमंडी नहीं वाला premium version” भी निकाल दें। तब काफ़ी लोग शायद उधर चले जाएँ
  • “5.2‑Instant” ब्रांडिंग उलझाऊ है
    लगा था यह ultra-fast मॉडल होगा, लेकिन यह तो बस router के बिना 5.2 version जैसा लगता है
    ऐसा महसूस हो रहा है कि OpenAI फिर से GPT‑5 से पहले वाली स्थिति में लौट रहा है, जहाँ मॉडल इतने ज़्यादा थे कि समझ नहीं आता था क्या इस्तेमाल करें

    • ChatGPT Plus असल में दो model families इस्तेमाल करता है
      एक है Instant series, जो तेज़ है और ChatGPT के लिए optimized है, लेकिन accuracy कम है
      दूसरी है Thinking series, जो धीमी है लेकिन professional कामों के लिए ज़्यादा उपयुक्त है
      इसे एक single option में सरल बनाना चाहते हैं, लेकिन users की पसंद अलग-अलग होने की वजह से दोनों मॉडल अभी भी दिए जा रहे हैं (यह लिखने वाला OpenAI कर्मचारी है)
    • लोगों को choice पसंद है, इसलिए “5.2” की जगह “5.2 Instant / 5.2 Thinking” जैसी पहचान ज़्यादा साफ़ है
      competitor Gemini 3 Fast / Gemini 3 Thinking भी यही तरीका अपनाता है
    • अभी भी रोज़ करीब 8 लाख लोग gpt‑4o इस्तेमाल कर रहे हैं, इसलिए उस user base को बनाए रखने का मकसद भी है
      “Thinking” मॉडल महँगे पड़ते हैं, इसलिए उन्हें सस्ते Instant मॉडल से जोड़े रखने की रणनीति है
    • असली benchmark देखने होंगे, लेकिन OpenAI के वर्णन के हिसाब से Instant एक latency-optimized मॉडल है
      voice interface में प्रति सेकंड token speed से ज़्यादा, पहले token आने तक का समय महत्वपूर्ण होता है
  • “GPT‑5.3 Instant: Smoother, more …” यह शीर्षक देखकर हँसी आ गई
    आजकल LLM के marketing slogans सिगरेट के विज्ञापनों जैसे लगते हैं

    • “GPT‑5.3 Instant: It’s toasted…”
    • “LLMenthols”
    • “GPT Super Mild”
    • “GPT Crush”
  • पेज पर “Better judgment around refusals” लिखा था,
    तो यह जिज्ञासा हुई कि क्या AI कंपनियों ने कभी आधिकारिक तौर पर उस समस्या पर बात की है जहाँ अलग-अलग समूहों पर अलग नियम लागू होते हैं
    जैसे किसी खास समूह पर मज़ाक से इनकार करना, लेकिन दूसरे समूह पर अनुमति देना
    और यह शोधपत्र दावा करता है कि मॉडल देशों के हिसाब से मानव जीवन के मूल्य को अलग तरह से आँकते हैं

    • क्या यह सामाजिक मानदंडों की झलक नहीं हो सकती?
    • मेरे लिए सबसे बड़ी समस्या US-केंद्रित पक्षपात थी
      “metric units में जवाब दो” कहने पर भी यह ठीक से नहीं मानता था, इसलिए cooking questions कई बार फिर से पूछने पड़ते थे
      अब थोड़ा बेहतर है, लेकिन अमेरिकी नज़रिया अभी भी काफ़ी मज़बूत है
    • मॉडल bias पर सवाल उठाना उचित है, लेकिन वह शोधपत्र methodology के लिहाज़ से कमज़ोर लगता है
      उसमें बकरी की कीमत के आधार पर मानव जीवन का “exchange rate” निकाला गया है, लेकिन वह शायद सिर्फ़ देशों के बीच कीमतों के अंतर को दिखा रहा हो
      sample भी सिर्फ़ 11 देशों का है, इसलिए सामान्यीकरण करना मुश्किल है
    • ACM शोधपत्र कहता है कि ऐसे “exchange rate” प्रयोग सिर्फ़ evaluation design का नतीजा हैं
      वे मॉडल की वास्तविक आंतरिक प्राथमिकताएँ नहीं दिखाते
      अगर neutral option दिया जाए, तो ज़्यादातर मॉडल सभी मानव जीवन को बराबर मानते हैं
      ऊपर से मूल शोधपत्र में डेटा साझा करना भी अपर्याप्त है, और कोड व परिणामों का संबंध समझना कठिन है, इसलिए उसकी विश्वसनीयता कम लगती है
  • तुलना लिंक के मुताबिक
    Gemini 3.1 Lite (no reasoning), GPT‑5.3 (no reasoning) से बेहतर प्रदर्शन करता है

    • और लागत भी बहुत कम है: GPT‑5.3 की $0.256 के मुकाबले Gemini लगभग $0.011 है
  • घोषणा के उदाहरण में लंबी दूरी की तोप के प्रक्षेपवक्र की गणना का ज़िक्र असहज लगा

    • असहज तो है, लेकिन अजीब नहीं
      OpenAI अमेरिकी सेना के साथ काम कर रहा है, इसलिए लगता है कि वह इस तरह के सैन्य उपयोग को सामान्य बनाने की कोशिश कर रहा है
      शायद यह रणनीति है कि ऐसे उदाहरणों को धीरे-धीरे रोज़मर्रा जैसा बनाकर विरोध को कुंद किया जाए
    • मैंने उस उदाहरण को शुरुआती कंप्यूटरों के ballistic calculations में इस्तेमाल होने वाले दौर की श्रद्धांजलि की तरह देखा
      लेकिन आज की परिस्थितियों को देखते हुए, पता नहीं वह व्याख्या सही है या नहीं
    • यह बस हाई स्कूल physics की किताब में आने वाला एक साधारण उदाहरण भी हो सकता है
    • हाल की घटनाओं को देखते हुए, ऐसा उदाहरण संवेदनहीन चूक जैसा दिखता है
    • किसी ने मज़ाक में यह भी कहा, “क्या हाल में कोई archery accident हुआ था?”
  • “GPT‑5.3 Instant वेब से लाई गई जानकारी को बेहतर ढंग से जोड़ता है” इस बात से सहमति है
    वास्तव में GPT, Claude की तुलना में search का उपयोग कहीं ज़्यादा स्वाभाविक ढंग से करता है

    • उल्टा मुझे लगता है कि Claude search बहुत ज़्यादा करता है
      ऊपर से web search बंद करने पर भी सेटिंग भूल जाने वाला bug है
  • मेरे benchmark में GPT‑5.3 ने 5.2‑chat के बराबर या उससे थोड़ा कम प्रदर्शन दिखाया
    इसलिए समझ आता है कि ब्लॉग में benchmark सार्वजनिक क्यों नहीं किए गए
    तुलना लिंक

  • दिलचस्प बात यह है कि “5.3 Instant” की घोषणा से ठीक पहले model picker से “Instant” विकल्प को पूरी तरह हटाकर
    उसे “Auto(लेकिन Auto-switch बंद होने की स्थिति में)” में बदल दिया गया
    “ऑटो, लेकिन ऑटो बंद है” जैसी व्याख्या खुद इस बात का सबूत लगती है कि वे भी उलझन में हैं