• GPT‑5.2 विशेषज्ञ ज्ञान-आधारित कार्यों के लिए सबसे मजबूत AI मॉडल श्रृंखला है, जिसमें कोड लिखना, इमेज पहचान और जटिल परियोजनाएँ करने की क्षमता बेहतर हुई है।
  • GDPval मूल्यांकन में 44 ज्ञान-कार्य टास्क्स में से 70.9% पर यह उद्योग विशेषज्ञों से बेहतर या बराबर रहा; गति 11x और लागत 1% से कम रही।
  • SWE‑Bench Pro 55.6%, GPQA Diamond 92.4%, ARC‑AGI‑1 86.2% जैसे प्रमुख बेंचमार्क पर सर्वोच्च प्रदर्शन हासिल किया।
  • लंबा कॉन्टेक्स्ट समझ (256k टोकन), विज़ुअल जानकारी प्रसंस्करण, टूल उपयोग (98.7%) में GPT‑5.1 की तुलना में बड़ा सुधार दिखा।
  • यह ChatGPT और API में चरणबद्ध तरीके से रोलआउट किया जाएगा और विशेषज्ञों के लिए उत्पादकता और विश्वसनीयता बढ़ाने को लक्ष्य बनाता है।

GPT‑5.2 का अवलोकन

  • GPT‑5.2 एक विशेषज्ञ ज्ञान-आधारित कामों के लिए AI मॉडल श्रृंखला है, जो स्प्रेडशीट निर्माण, प्रस्तुतीकरण बनाना, कोड लेखन, इमेज पहचान, लंबा टेक्स्ट समझना, टूल उपयोग और जटिल परियोजनाएँ संभालने की क्षमता को मजबूत करता है।
  • ChatGPT Enterprise उपयोगकर्ता पहले से ही औसतन प्रति दिन 40–60 मिनट और प्रति सप्ताह 10 घंटे से अधिक समय बचा रहे हैं; GPT‑5.2 इस दक्षता को और बढ़ाने का दावा करता है।
  • ChatGPT में इसे Instant, Thinking, Pro के तीन वर्ज़न में उपलब्ध कराया गया है, जबकि API में डेवलपर्स के लिए तुरंत रिलीज़ किया गया है।

मॉडल प्रदर्शन

  • GPT‑5.2 Thinking ने GDPval मूल्यांकन में पहली बार विशेषज्ञ-स्तर से ऊपर का प्रदर्शन हासिल किया।
    • 44 ज्ञान-कार्य टास्क्स में से 70.9% में विशेषज्ञों को पार करने या बराबरी करने का परिणाम मिला।
    • विशेषज्ञों की तुलना में 11x तेज़ और लागत में 1% से कम।
  • आंतरिक परीक्षण में निवेश बैंक विश्लेषण के लिए स्प्रेडशीट मॉडलिंग कार्य का स्कोर GPT‑5.1 की तुलना में 9.3% बढ़ा (59.1% → 68.4%)।
  • SWE‑Bench Pro 55.6%, SWE‑Bench Verified 80% के साथ सॉफ़्टवेयर इंजीनियरिंग प्रदर्शन में सुधार दिखा।
    • वास्तविक code debugging, feature implementation, refactoring और deployment में अधिक स्थिर निष्पादन।
  • फ्रंटएंड डेवलपमेंट और 3D UI कार्यों में भी GPT‑5.1 की तुलना में सुधार।
  • त्रुटिपूर्ण उत्तर दर 30% घटी, जिससे हैलुसिनेशन (hallucination) की आवृत्ति कम हुई।

लंबा कॉन्टेक्स्ट समझ और विज़ुअल पहचान

  • OpenAI MRCRv2 मूल्यांकन में लंबी दस्तावेज़-समझ को एकीकृत करने की क्षमता में शीर्ष परिणाम।
    • 256k टोकन तक लगभग 100% सटीकता हासिल की।
    • रिपोर्ट, कॉन्ट्रैक्ट और रिसर्च पेपर जैसे लंबी लंबाई के दस्तावेज़ विश्लेषण के लिए अनुकूल।
  • /compact endpoint के साथ संगत होने के कारण context-extending workflow का समर्थन।
  • विज़ुअल पहचान बेहतर होने से चार्ट, डैशबोर्ड और UI स्क्रीनशॉट जैसे मामलों में त्रुटि दर लगभग आधी रह गई।
    • इमेज के भीतर घटकों की spatial arrangement समझने की क्षमता मजबूत हुई।

टूल उपयोग और मिश्रित कार्य

  • Tau2‑bench Telecom 98.7% के साथ टूल उपयोग क्षमता में शीर्ष रिकॉर्ड।
  • मल्टी-स्टेप ग्राहक सहायता, डेटा संग्रह, विश्लेषण और परिणाम निर्माण जैसी एंड‑टू‑एंड वर्कफ्लो क्षमताएँ मजबूत हुईं।
    • उदाहरण: उड़ान देरी, कनेक्टिंग फ्लाइट और मुआवज़ा अनुरोध जैसी जटिल ग्राहक सेवा प्रक्रियाओं को पूरी तरह से संभालना।

वैज्ञानिक, गणितीय और तर्क क्षमता

  • GPQA Diamond 92.4%, FrontierMath Tier 1–3 40.3%, ARC‑AGI‑1 86.2%, ARC‑AGI‑2 52.9% के साथ प्रमुख शोध-उन्मुख बेंचमार्क में शीर्ष परिणाम।
  • GPT‑5.2 Pro ने ARC‑AGI‑1 में 90% पार किया, और cost efficiency में 390x सुधार दिखाया।
  • GPT‑5.2 Pro और Thinking को scientific research acceleration के लिए उपयोगी माना गया।
    • वास्तविक शोध में सांख्यिकी के सैद्धांतिक प्रमाण का प्रस्ताव और सत्यापन करवाने का उदाहरण दिया गया।

ChatGPT के अंदर उपयोग अनुभव

  • GPT‑5.2 Instant: तेज़ उत्तर और साफ़ व्याख्या देता है, रोज़मर्रा के अध्ययन और काम के लिए उपयुक्त।
  • GPT‑5.2 Thinking: कोड लेखन, लंबा सारांश बनाना, गणित/तर्क समस्याएँ हल करना और प्लानिंग जैसे जटिल कार्यों के लिए उपयुक्त।
  • GPT‑5.2 Pro: कठिन प्रश्नों पर अधिक भरोसेमंद उत्तर देता है और गलतियों की दर घटती है।

सुरक्षा में सुधार

  • GPT‑5.2, GPT‑5 के Safe Completion research पर आधारित है और आत्महत्या, मानसिक स्वास्थ्य तथा भावनात्मक निर्भरता से जुड़ी बातचीतों में जवाबों को बेहतर बनाने पर केंद्रित है।
    • GPT‑5.1 की तुलना में अनुपयुक्त प्रतिक्रियाओं का अनुपात कम हुआ।
  • age prediction model लागू कर 18 वर्ष से कम उम्र के उपयोगकर्ताओं के लिए संवेदनशील कंटेंट तक पहुँच सीमित की गई।
  • ChatGPT में excessive refusal (over‑refusal) समस्या को सुधारने का काम चल रहा है।

कीमत और उपलब्धता

  • ChatGPT के पेड प्लान (Plus, Pro, Business, Enterprise) से चरणबद्ध रिलीज़ शुरू।
  • API में gpt‑5.2, gpt‑5.2‑chat‑latest, gpt‑5.2‑pro के नाम से उपलब्ध।
  • मूल्य: प्रति 1 मिलियन इनपुट टोकन $1.75, प्रति 1 मिलियन आउटपुट टोकन $14, कैश इनपुट पर 90% डिस्काउंट।
    • GPT‑5.1 से प्रति यूनिट महँगा होने के बावजूद बेहतर token efficiency के कारण कुल लागत घट सकती है।
  • GPT‑5.1 को तीन महीने तक जारी रखकर चरणबद्ध रूप से बंद करने की योजना है।
  • Codex optimized संस्करण बाद में जारी किया जाएगा।

तकनीकी साझेदारी

  • NVIDIA और Microsoft के साथ मिलकर GPT‑5.2 विकसित किया गया।
    • Azure डेटा सेंटर और H100, H200, GB200‑NVL72 GPU इंफ्रास्ट्रक्चर का उपयोग किया गया।
    • यह बड़े पैमाने पर प्रशिक्षण दक्षता और मॉडल की बुद्धिमत्ता सुधारने में मददगार रहा।

प्रमुख बेंचमार्क सारांश

  • GDPval: 70.9% (GPT‑5.1 38.8%)
  • SWE‑Bench Verified: 80.0%
  • OpenAI MRCRv2 (256k): 77.0%
  • CharXiv Reasoning (w/ Python): 88.7%
  • Tau2‑bench Telecom: 98.7%
  • ARC‑AGI‑1 (Verified): 86.2%
  • AIME 2025: 100%
  • FrontierMath Tier 1–3: 40.3%

GPT‑5.2 बुद्धिमत्ता, विश्वसनीयता और उत्पादकता में पिछली पीढ़ी के मॉडलों पर स्पष्ट बढ़त दिखाता है और एक विशेषज्ञ-स्तरीय व्यावहारिक AI सहायक के रूप में स्थापित होने का प्रयास करता है।

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.