- ChatGPT का सबसे ज़्यादा इस्तेमाल होने वाला मॉडल अपडेट किया गया है, जिससे रोज़मर्रा की बातचीत में सटीकता, प्रवाह और संदर्भ समझने की क्षमता बेहतर हुई है
- नया वर्ज़न अनावश्यक इनकार और चेतावनी संदेशों को कम करता है और सवालों के सीधे और व्यावहारिक जवाब देता है
- वेब सर्च के दौरान जानकारी को एकीकृत करने की क्षमता बेहतर हुई है, जिससे साधारण सारांश की जगह संदर्भित जवाब तैयार होते हैं
- बातचीत का टोन और लेखन शैली अधिक प्राकृतिक और संक्षिप्त हो गई है, साथ ही तथ्यात्मक सटीकता और रचनात्मक लेखन की गुणवत्ता भी मजबूत हुई है
- GPT‑5.3 Instant ChatGPT और API में तुरंत उपलब्ध है, जबकि मौजूदा GPT‑5.2 Instant का सपोर्ट 3 जून 2026 को समाप्त होने वाला है
GPT‑5.3 Instant अवलोकन
- यह एक ऐसा अपडेट है जो ChatGPT की रोज़मर्रा की बातचीत की गुणवत्ता को समग्र रूप से बेहतर बनाता है, और सटीक जवाब, संदर्भ समझना, तथा बातचीत के प्रवाह को बनाए रखने पर केंद्रित है
- अनावश्यक रुकावटें, अत्यधिक सावधानी वाले संकेत, और घोषणात्मक शैली को कम करके बातचीत की स्वाभाविकता बढ़ाई गई है
- यूज़र फीडबैक को शामिल करते हुए टोन, प्रासंगिकता और बातचीत के प्रवाह में सुधार किया गया है
- यह अपडेट रोज़मर्रा के उपयोग अनुभव को ध्यान में रखकर डिज़ाइन किया गया है, इसलिए benchmark संख्याओं की बजाय अनुभवजन्य गुणवत्ता सुधार पर ज़ोर है
अनावश्यक इनकार में कमी और संक्षिप्त जवाब
- पिछले वर्ज़न (GPT‑5.2 Instant) में यह समस्या थी कि वह ऐसे सवालों को भी ज़रूरत से ज़्यादा अस्वीकार कर देता था जिनका सुरक्षित जवाब दिया जा सकता था, या नैतिक भूमिका के कारण जवाब देने में देरी होती थी
- GPT‑5.3 Instant अनावश्यक इनकार कम करता है और सवाल-केंद्रित, सीधे जवाब देता है
- उदाहरण: लंबी दूरी की तीरंदाज़ी की गणना के अनुरोध पर, GPT‑5.2 सुरक्षा चेतावनी के साथ लंबी भूमिका देता था
जबकि GPT‑5.3 सीधे ज़रूरी भौतिक चर (धनुष की ताकत, तीर का द्रव्यमान, वेग आदि) पूछकर गणना आगे बढ़ाता है
- नतीजतन बातचीत में रुकावट कम होती है और तुरंत व व्यावहारिक जवाब संभव होते हैं
वेब सर्च आधारित जवाबों की गुणवत्ता में सुधार
- GPT‑5.3 Instant वेब से मिली जानकारी को अपने ज्ञान और reasoning क्षमता के साथ जोड़कर संदर्भित जवाब बनाता है
- सिर्फ लिंक की सूची या दोहराई गई जानकारी देने के बजाय, यह मुख्य सारांश और अर्थपूर्ण संबंध को प्राथमिकता देता है
- उदाहरण: “2025–26 MLB offseason का सबसे बड़ा कॉन्ट्रैक्ट” सवाल में
- GPT‑5.2 ने पिछले सीज़न के बाद के उदाहरणों की व्याख्या की थी
- जबकि GPT‑5.3 ने Kyle Tucker का LA Dodgers के साथ 4 साल का 240 मिलियन डॉलर का कॉन्ट्रैक्ट सही ढंग से बताया,
और लीग संरचना में बदलाव तथा श्रम-प्रबंधन वार्ता के प्रभाव तक जोड़कर समझाया
- नतीजतन ताज़गी, प्रासंगिकता और संदर्भ-सटीकता बेहतर हुई है
बातचीत की शैली में स्वाभाविकता
- GPT‑5.2 Instant के कुछ जवाबों पर यह फीडबैक था कि वे ज़रूरत से ज़्यादा सांत्वना देने वाले वाक्य या भावनाओं का अनुमान लगाते हैं, जिससे वे “अस्वाभाविक” लगते हैं
- GPT‑5.3 Instant अनावश्यक भावनात्मक अभिव्यक्तियों को कम करता है और मुख्य बिंदु पर केंद्रित, प्राकृतिक संवाद शैली देता है
- उदाहरण: “San Francisco में प्यार पाना मुश्किल क्यों है” सवाल पर
GPT‑5.3 शहरी संस्कृति, गतिशीलता, और भावनात्मक दूरी जैसे संरचनात्मक कारणों को व्यवस्थित रूप से समझाता है
- “तुम ठीक हो” जैसी शुरुआत के बिना, यह सीधा और सहज रूप से जुड़ने वाला विश्लेषणात्मक जवाब देता है
तथ्यात्मक सटीकता में सुधार
- GPT‑5.3 Instant ने चिकित्सा, कानून, वित्त जैसे high-risk क्षेत्रों में hallucination की दर को काफी कम किया है
- वेब उपयोग के दौरान hallucination दर में 26.8% कमी, और केवल आंतरिक ज्ञान उपयोग करते समय 19.7% कमी
- यूज़र फीडबैक आधारित मूल्यांकन में भी 22.5% (वेब उपयोग) और 9.6% (गैर-वेब) की कमी दर्ज की गई
- तथ्य-आधारित जवाबों की विश्वसनीयता बढ़ी है, जिससे व्यावहारिक उपयोगिता मजबूत हुई है
लेखन क्षमता में मजबूती
- GPT‑5.3 Instant में कथात्मक गहराई और भावनात्मक अभिव्यक्ति बेहतर हुई है, जिससे यह रचनात्मक लेखन और साहित्यिक वर्णन में मजबूत दिखता है
- उदाहरण: “रिटायर हो रहे Philadelphia डाकिए की आख़िरी डिलीवरी” पर कविता लिखने के अनुरोध में
GPT‑5.3 ठोस दृश्य और संवेदी विवरण के ज़रिए भावनाओं को स्वाभाविक रूप से व्यक्त करता है
- GPT‑5.2 के भावुक वर्णन की तुलना में इसमें संरचनात्मक पूर्णता और यथार्थ-बोध अधिक है
सीमाएँ और आगे के सुधार
- गैर-अंग्रेज़ी भाषाओं (जैसे जापानी, कोरियाई) में अभी भी अटपटे या शाब्दिक अनुवाद जैसे वाक्य आ सकते हैं
- भाषा-विशेष स्वाभाविक टोन सुधारना आगे की चुनौती है
- जवाब के टोन को समायोजित करने की सुविधा पर अभी काम जारी है, और यूज़र फीडबैक लगातार इकट्ठा किया जा रहा है
उपलब्धता और ट्रांज़िशन योजना
- GPT‑5.3 Instant सभी ChatGPT यूज़र्स और API (
gpt‑5.3‑chat‑latest) में तुरंत उपलब्ध है
- Thinking और Pro मॉडल अपडेट भी जल्द आने वाले हैं
- GPT‑5.2 Instant का सपोर्ट 3 जून 2026 को समाप्त होगा, और पेड यूज़र्स को यह 3 महीने तक ‘Legacy Models’ के रूप में उपलब्ध रहेगा
1 टिप्पणियां
Hacker News की राय
अभी ChatGPT की सबसे बड़ी समस्या उसके जवाबों का अटपटा लहजा है
“Why it matters”, “the big picture” जैसे वाक्यांश, बढ़ा-चढ़ाकर ज़ोर देना, और rhetorical questions बहुत ज़्यादा हो गए हैं
शुरुआत वाला GPT‑5 वर्ज़न ठीक था, लेकिन “ज़्यादा warm personality” बनाने की कोशिश में वह उल्टा 4o जैसा खराब हो गया
पहले यह जापानी भी अच्छी करता था, लेकिन अब क्वालिटी गिर गई है, जो निराशाजनक है
इसलिए अब मैं sound effects तक डालकर <i>swoosh</i> नई writing style आज़मा रहा हूँ
LLM के output को रेफ़रेंस की तरह लेता हूँ, लेकिन उसे ज्यों-का-त्यों कॉपी नहीं करता, बल्कि अपनी आवाज़ में फिर से लिखकर अपना स्टाइल बनाए रखने की कोशिश करता हूँ
“5.2‑Instant” ब्रांडिंग उलझाऊ है
लगा था यह ultra-fast मॉडल होगा, लेकिन यह तो बस router के बिना 5.2 version जैसा लगता है
ऐसा महसूस हो रहा है कि OpenAI फिर से GPT‑5 से पहले वाली स्थिति में लौट रहा है, जहाँ मॉडल इतने ज़्यादा थे कि समझ नहीं आता था क्या इस्तेमाल करें
एक है Instant series, जो तेज़ है और ChatGPT के लिए optimized है, लेकिन accuracy कम है
दूसरी है Thinking series, जो धीमी है लेकिन professional कामों के लिए ज़्यादा उपयुक्त है
इसे एक single option में सरल बनाना चाहते हैं, लेकिन users की पसंद अलग-अलग होने की वजह से दोनों मॉडल अभी भी दिए जा रहे हैं (यह लिखने वाला OpenAI कर्मचारी है)
competitor Gemini 3 Fast / Gemini 3 Thinking भी यही तरीका अपनाता है
“Thinking” मॉडल महँगे पड़ते हैं, इसलिए उन्हें सस्ते Instant मॉडल से जोड़े रखने की रणनीति है
voice interface में प्रति सेकंड token speed से ज़्यादा, पहले token आने तक का समय महत्वपूर्ण होता है
“GPT‑5.3 Instant: Smoother, more …” यह शीर्षक देखकर हँसी आ गई
आजकल LLM के marketing slogans सिगरेट के विज्ञापनों जैसे लगते हैं
पेज पर “Better judgment around refusals” लिखा था,
तो यह जिज्ञासा हुई कि क्या AI कंपनियों ने कभी आधिकारिक तौर पर उस समस्या पर बात की है जहाँ अलग-अलग समूहों पर अलग नियम लागू होते हैं
जैसे किसी खास समूह पर मज़ाक से इनकार करना, लेकिन दूसरे समूह पर अनुमति देना
और यह शोधपत्र दावा करता है कि मॉडल देशों के हिसाब से मानव जीवन के मूल्य को अलग तरह से आँकते हैं
“metric units में जवाब दो” कहने पर भी यह ठीक से नहीं मानता था, इसलिए cooking questions कई बार फिर से पूछने पड़ते थे
अब थोड़ा बेहतर है, लेकिन अमेरिकी नज़रिया अभी भी काफ़ी मज़बूत है
उसमें बकरी की कीमत के आधार पर मानव जीवन का “exchange rate” निकाला गया है, लेकिन वह शायद सिर्फ़ देशों के बीच कीमतों के अंतर को दिखा रहा हो
sample भी सिर्फ़ 11 देशों का है, इसलिए सामान्यीकरण करना मुश्किल है
वे मॉडल की वास्तविक आंतरिक प्राथमिकताएँ नहीं दिखाते
अगर neutral option दिया जाए, तो ज़्यादातर मॉडल सभी मानव जीवन को बराबर मानते हैं
ऊपर से मूल शोधपत्र में डेटा साझा करना भी अपर्याप्त है, और कोड व परिणामों का संबंध समझना कठिन है, इसलिए उसकी विश्वसनीयता कम लगती है
तुलना लिंक के मुताबिक
Gemini 3.1 Lite (no reasoning), GPT‑5.3 (no reasoning) से बेहतर प्रदर्शन करता है
घोषणा के उदाहरण में लंबी दूरी की तोप के प्रक्षेपवक्र की गणना का ज़िक्र असहज लगा
OpenAI अमेरिकी सेना के साथ काम कर रहा है, इसलिए लगता है कि वह इस तरह के सैन्य उपयोग को सामान्य बनाने की कोशिश कर रहा है
शायद यह रणनीति है कि ऐसे उदाहरणों को धीरे-धीरे रोज़मर्रा जैसा बनाकर विरोध को कुंद किया जाए
लेकिन आज की परिस्थितियों को देखते हुए, पता नहीं वह व्याख्या सही है या नहीं
“GPT‑5.3 Instant वेब से लाई गई जानकारी को बेहतर ढंग से जोड़ता है” इस बात से सहमति है
वास्तव में GPT, Claude की तुलना में search का उपयोग कहीं ज़्यादा स्वाभाविक ढंग से करता है
ऊपर से web search बंद करने पर भी सेटिंग भूल जाने वाला bug है
मेरे benchmark में GPT‑5.3 ने 5.2‑chat के बराबर या उससे थोड़ा कम प्रदर्शन दिखाया
इसलिए समझ आता है कि ब्लॉग में benchmark सार्वजनिक क्यों नहीं किए गए
तुलना लिंक
दिलचस्प बात यह है कि “5.3 Instant” की घोषणा से ठीक पहले model picker से “Instant” विकल्प को पूरी तरह हटाकर
उसे “Auto(लेकिन Auto-switch बंद होने की स्थिति में)” में बदल दिया गया
“ऑटो, लेकिन ऑटो बंद है” जैसी व्याख्या खुद इस बात का सबूत लगती है कि वे भी उलझन में हैं