OpenAI ने GPT-4.5 पेश किया

xguru · 2025-02-28T09:19:15+09:00

GPT-4.5 OpenAI का नवीनतम मॉडल है, जो pre-training और post-training में scalability को बेहतर बनाने वाला संस्करण है unsupervised learning के scale को बढ़ाकर pattern recognition और creative insight को मजबूत किया गया है अब अधिक स्वाभाविक बातचीत संभव है, यह user intent को बेहतर समझता है और emotional intelligence (EQ) भी बेहतर हुई है writing, programming, problem solving जैसे कई तरह के कामों में उपयोगी है hallucination की दर कम होने की उम्मीद है इसे research preview के रूप में उपलब्ध कराया गया है, ताकि मॉडल की ताकत और सीमाओं को समझा जा सके और विभिन्न use cases इकट्ठा किए जा सकें बिना पर्यवेक्षण वाले शिक्षण का विस्तार AI की प्रगति के लिए unsupervised learning और reasoning के दो अक्षों का विस्तार किया जा रहा है reasoning को मजबूत करना: जटिल STEM समस्याओं को हल करने के लिए मॉडल को व्यवस्थित तरीके से सोचने के लिए प्रशिक्षित किया गया है OpenAI o1, OpenAI o3-mini जैसे मॉडल इस approach को आगे बढ़ाते हैं unsupervised learning का विस्तार: अधिक डेटा के जरिए मॉडल की intuition और world knowledge की accuracy बढ़ाई जाती है GPT-4.5 को Microsoft Azure AI सुपरकंप्यूटर पर प्रशिक्षित किया गया है, और इसमें अधिक व्यापक ज्ञान व गहरी समझ है इससे hallucination कम होती है और अलग-अलग विषयों पर अधिक भरोसेमंद परिणाम मिलते हैं GPT प्रतिमान का विस्तार GPT-4.5 के पास पिछले मॉडलों की तुलना में बेहतर knowledge है भाषा की उत्पत्ति जैसे ऐतिहासिक प्रश्नों पर यह अधिक गहरी insight देता है "पहली भाषा क्या थी?" जैसे सवाल पर: संभव है कि कोई एकमात्र पहली भाषा कभी रही ही न हो अनुमान है कि भाषा अफ्रीका में 1 लाख वर्ष से भी पहले उभरी होगी proto-languages संभवतः gestures, sounds और signals से विकसित हुई होंगी लिखित अभिलेख न होने के कारण भाषा की सटीक उत्पत्ति पता नहीं लगाई जा सकती इस तरह GPT-4.5 linguistics और history जैसे क्षेत्रों में भी गहराई वाले उत्तर दे सकता है अधिक गहरा विश्व ज्ञान SimpleQA evaluation results में GPT-4.5 ने अन्य मॉडलों की तुलना में अधिक accuracy दर्ज की Accuracy तुलना: GPT-4.5: 62.5% GPT-4o: 38.2% OpenAI o1: 47% OpenAI o3-mini: 15% Hallucination Rate तुलना (कम होना बेहतर है): GPT-4.5: 37.1% GPT-4o: 61.8% OpenAI o1: 44% OpenAI o3-mini: 80.3% GPT-4.5 fact-checking की जरूरत वाले सवालों में अधिक accuracy बनाए रखता है और hallucination rate को कम करता है मनुष्यों के साथ सहयोग के लिए प्रशिक्षण GPT-4.5 को मानव की जरूरतों और इरादों को बेहतर समझने के लिए प्रशिक्षित किया गया है यह user intent को अधिक सूक्ष्मता से समझता है और अधिक natural conversation संभव बनाता है पिछले मॉडलों की तुलना में emotional intelligence (EQ) बेहतर हुई है, इसलिए यह सूक्ष्म nuances को बेहतर समझता है writing और design कार्यों में इसकी creative intuition और aesthetic sense बेहतर है तुलनात्मक मूल्यांकन (Win-rate vs GPT-4o) creative tasks: 56.8% professional questions: 63.2% everyday questions: 57.0% GPT-4.5 इंसानों के साथ सहयोग को अधिक स्वाभाविक रूप से कर सकता है और बातचीत के दौरान user intent को अधिक सटीकता से समझता है आगे की दिशा: अधिक शक्तिशाली तर्क क्षमता GPT-4.5 ऐसा मॉडल नहीं है जो उत्तर देने से पहले तार्किक रूप से सोचता हो यह OpenAI o1 और OpenAI o3-mini जैसे reasoning-केंद्रित मॉडलों से अलग approach अपनाता है भविष्य के मॉडलों में pre-training और reasoning के संयोजन को प्रमुख दिशा माना जा रहा है सुरक्षा सुदृढ़ीकरण GPT-4.5 को नई supervision techniques के साथ प्रशिक्षित किया गया है, जिनमें मौजूदा SFT (supervised fine-tuning) और RLHF (reinforcement learning from human feedback) शामिल हैं मॉडल को deploy करने से पहले safety tests किए गए ताकि संभावित जोखिमों का आकलन किया जा सके मूल्यांकन परिणामों वाली system card प्रकाशित की गई है, ताकि research और feedback को बढ़ावा दिया जा सके ChatGPT में GPT-4.5 उपयोग करने का तरीका आज से ChatGPT Pro users वेब, मोबाइल और डेस्कटॉप पर GPT-4.5 चुन सकते हैं अगले सप्ताह Plus और Team users के लिए उपलब्ध कराया जाएगा उसके अगले सप्ताह Enterprise और Edu users के लिए उपलब्ध कराया जाएगा मुख्य सुविधाएँ: नवीनतम जानकारी खोजने की क्षमता files और images upload का समर्थन canvas का उपयोग करके writing और coding कार्य संभव हालांकि, voice mode, video और screen sharing features समर्थित नहीं हैं API में GPT-4.5 उपयोग करने का तरीका Chat Completions API, Assistants API, Batch API के जरिए developers को उपलब्ध कराया जा रहा है मुख्य सुविधाएँ: Function Calling Structured Outputs Streaming System Messages image input के जरिए vision capabilities का समर्थन developers के उपयोग के उदाहरण: ऐसे applications जहाँ emotional intelligence और creativity महत्वपूर्ण हैं (जैसे writing assistant, learning coaching, brainstorming) जटिल code tasks (जैसे multi-step coding workflows, automation) API उपलब्धता से जुड़े विचार: GPT-4.5 एक high-compute और high-cost मॉडल है, इसलिए यह GPT-4o को replace नहीं करता इसे API में लंबे समय तक उपलब्ध रखा जाए या नहीं, इस पर विचार चल रहा है, और user feedback महत्वपूर्ण है निष्कर्ष GPT-4.5 unsupervised learning की सीमाओं का विस्तार करने वाला मॉडल है, जो creative और नए features को explore करने में मदद कर सकता है यह AI तकनीक की नई संभावनाओं की खोज करता है, और users के innovative use cases की अपेक्षा करता है.

(openai.com)

4 पॉइंट द्वारा xguru 2025-02-28 | 4 टिप्पणियां | WhatsApp पर शेयर करें

GPT-4.5 OpenAI का नवीनतम मॉडल है, जो pre-training और post-training में scalability को बेहतर बनाने वाला संस्करण है
unsupervised learning के scale को बढ़ाकर pattern recognition और creative insight को मजबूत किया गया है
अब अधिक स्वाभाविक बातचीत संभव है, यह user intent को बेहतर समझता है और emotional intelligence (EQ) भी बेहतर हुई है
writing, programming, problem solving जैसे कई तरह के कामों में उपयोगी है
hallucination की दर कम होने की उम्मीद है
इसे research preview के रूप में उपलब्ध कराया गया है, ताकि मॉडल की ताकत और सीमाओं को समझा जा सके और विभिन्न use cases इकट्ठा किए जा सकें

बिना पर्यवेक्षण वाले शिक्षण का विस्तार

AI की प्रगति के लिए unsupervised learning और reasoning के दो अक्षों का विस्तार किया जा रहा है
- reasoning को मजबूत करना: जटिल STEM समस्याओं को हल करने के लिए मॉडल को व्यवस्थित तरीके से सोचने के लिए प्रशिक्षित किया गया है
  - OpenAI o1, OpenAI o3-mini जैसे मॉडल इस approach को आगे बढ़ाते हैं
- unsupervised learning का विस्तार: अधिक डेटा के जरिए मॉडल की intuition और world knowledge की accuracy बढ़ाई जाती है
GPT-4.5 को Microsoft Azure AI सुपरकंप्यूटर पर प्रशिक्षित किया गया है, और इसमें अधिक व्यापक ज्ञान व गहरी समझ है
- इससे hallucination कम होती है और अलग-अलग विषयों पर अधिक भरोसेमंद परिणाम मिलते हैं

GPT प्रतिमान का विस्तार

GPT-4.5 के पास पिछले मॉडलों की तुलना में बेहतर knowledge है
- भाषा की उत्पत्ति जैसे ऐतिहासिक प्रश्नों पर यह अधिक गहरी insight देता है
- "पहली भाषा क्या थी?" जैसे सवाल पर:
  - संभव है कि कोई एकमात्र पहली भाषा कभी रही ही न हो
  - अनुमान है कि भाषा अफ्रीका में 1 लाख वर्ष से भी पहले उभरी होगी
  - proto-languages संभवतः gestures, sounds और signals से विकसित हुई होंगी
  - लिखित अभिलेख न होने के कारण भाषा की सटीक उत्पत्ति पता नहीं लगाई जा सकती
इस तरह GPT-4.5 linguistics और history जैसे क्षेत्रों में भी गहराई वाले उत्तर दे सकता है

अधिक गहरा विश्व ज्ञान

SimpleQA evaluation results में GPT-4.5 ने अन्य मॉडलों की तुलना में अधिक accuracy दर्ज की
- Accuracy तुलना:
  - GPT-4.5: 62.5%
  - GPT-4o: 38.2%
  - OpenAI o1: 47%
  - OpenAI o3-mini: 15%
- Hallucination Rate तुलना (कम होना बेहतर है):
  - GPT-4.5: 37.1%
  - GPT-4o: 61.8%
  - OpenAI o1: 44%
  - OpenAI o3-mini: 80.3%
GPT-4.5 fact-checking की जरूरत वाले सवालों में अधिक accuracy बनाए रखता है और hallucination rate को कम करता है

मनुष्यों के साथ सहयोग के लिए प्रशिक्षण

GPT-4.5 को मानव की जरूरतों और इरादों को बेहतर समझने के लिए प्रशिक्षित किया गया है
- यह user intent को अधिक सूक्ष्मता से समझता है और अधिक natural conversation संभव बनाता है
- पिछले मॉडलों की तुलना में emotional intelligence (EQ) बेहतर हुई है, इसलिए यह सूक्ष्म nuances को बेहतर समझता है
- writing और design कार्यों में इसकी creative intuition और aesthetic sense बेहतर है
तुलनात्मक मूल्यांकन (Win-rate vs GPT-4o)
- creative tasks: 56.8%
- professional questions: 63.2%
- everyday questions: 57.0%
GPT-4.5 इंसानों के साथ सहयोग को अधिक स्वाभाविक रूप से कर सकता है और बातचीत के दौरान user intent को अधिक सटीकता से समझता है

आगे की दिशा: अधिक शक्तिशाली तर्क क्षमता

GPT-4.5 ऐसा मॉडल नहीं है जो उत्तर देने से पहले तार्किक रूप से सोचता हो
यह OpenAI o1 और OpenAI o3-mini जैसे reasoning-केंद्रित मॉडलों से अलग approach अपनाता है
भविष्य के मॉडलों में pre-training और reasoning के संयोजन को प्रमुख दिशा माना जा रहा है

सुरक्षा सुदृढ़ीकरण

GPT-4.5 को नई supervision techniques के साथ प्रशिक्षित किया गया है, जिनमें मौजूदा SFT (supervised fine-tuning) और RLHF (reinforcement learning from human feedback) शामिल हैं
मॉडल को deploy करने से पहले safety tests किए गए ताकि संभावित जोखिमों का आकलन किया जा सके
मूल्यांकन परिणामों वाली system card प्रकाशित की गई है, ताकि research और feedback को बढ़ावा दिया जा सके

ChatGPT में GPT-4.5 उपयोग करने का तरीका

आज से ChatGPT Pro users वेब, मोबाइल और डेस्कटॉप पर GPT-4.5 चुन सकते हैं
अगले सप्ताह Plus और Team users के लिए उपलब्ध कराया जाएगा
उसके अगले सप्ताह Enterprise और Edu users के लिए उपलब्ध कराया जाएगा
मुख्य सुविधाएँ:
- नवीनतम जानकारी खोजने की क्षमता
- files और images upload का समर्थन
- canvas का उपयोग करके writing और coding कार्य संभव
- हालांकि, voice mode, video और screen sharing features समर्थित नहीं हैं

API में GPT-4.5 उपयोग करने का तरीका

Chat Completions API, Assistants API, Batch API के जरिए developers को उपलब्ध कराया जा रहा है
मुख्य सुविधाएँ:
- Function Calling
- Structured Outputs
- Streaming
- System Messages
- image input के जरिए vision capabilities का समर्थन
developers के उपयोग के उदाहरण:
- ऐसे applications जहाँ emotional intelligence और creativity महत्वपूर्ण हैं (जैसे writing assistant, learning coaching, brainstorming)
- जटिल code tasks (जैसे multi-step coding workflows, automation)
API उपलब्धता से जुड़े विचार:
- GPT-4.5 एक high-compute और high-cost मॉडल है, इसलिए यह GPT-4o को replace नहीं करता
- इसे API में लंबे समय तक उपलब्ध रखा जाए या नहीं, इस पर विचार चल रहा है, और user feedback महत्वपूर्ण है

निष्कर्ष

GPT-4.5 unsupervised learning की सीमाओं का विस्तार करने वाला मॉडल है, जो creative और नए features को explore करने में मदद कर सकता है
यह AI तकनीक की नई संभावनाओं की खोज करता है, और users के innovative use cases की अपेक्षा करता है.

4 टिप्पणियां

GN⁺ 2025-02-28

Hacker News टिप्पणियाँ

GPT 4.5 की कीमत बहुत अधिक है
- इनपुट: 1 मिलियन tokens पर $75.00
- cached input: 1 मिलियन tokens पर $37.50
- आउटपुट: 1 मिलियन tokens पर $150.00
- GPT 4o की तुलना में कीमत का अंतर बहुत बड़ा है
- GPT-4.5 एक बहुत बड़ा और compute-intensive मॉडल है, और यह आकलन किया जा रहा है कि इसे लंबे समय तक API में उपलब्ध रखा जाए या नहीं
- user feedback महत्वपूर्ण है
GPT-4.5 इस्तेमाल करने का अनुभव
- बहुत धीमा है, real-time interaction के लिए उपयुक्त नहीं
- लेखन शैली में सुधार हुआ है, यह अधिक casual और approachable लगता है
- किताब के draft की तुलना में GPT4o और GPT4.5 के बीच का अंतर साफ़ दिखाई देता है
emotional intelligence (EQ) पर फ़ोकस
- यह "दयालु AI दोस्त" में बदलने की प्रवृत्ति दिखाता है
- Anthropic और Grok भी इसी दिशा में बढ़ रहे हैं
- उम्मीद है कि API responses में यह व्यवहार न घुले
ब्लॉग पोस्ट और live stream demo से निराशा
- नया मॉडल प्रभावशाली नहीं लगा
- लगता है OpenAI के लिए प्रतिस्पर्धियों से आगे निकलना मुश्किल हो रहा है
- कीमत बहुत अधिक होने से हैरानी हुई
OpenAI और Anthropic के अलग-अलग दृष्टिकोण
- Anthropic मानता है कि एक ही paradigm (reasoning) सभी use cases के लिए उपयुक्त हो सकता है
- OpenAI मानता है कि अलग-अलग क्षमताओं वाले models का ensemble ज़रूरी है
- GPT 4.5 इतना बड़ा है कि यह अधिक factual data स्टोर कर सकता है
Kagi LLM benchmark में GPT-4.5 का प्रदर्शन
- ऊँची कीमत और धीमी गति के बावजूद प्रदर्शन शानदार है
- कुछ कार्यों में अभी भी कमी है
API के माध्यम से GPT-4.5 इस्तेमाल करने का तरीका
- uvx tool का उपयोग करके चलाया जा सकता है
- API key सेट करना ज़रूरी है
coding performance की तुलना
- ChatGPT 4.5, ChatGPT 4o से coding में थोड़ा बेहतर है
- Anthropic Claude 3.7 ने बेहतर प्रदर्शन दिखाया
OpenAI के इस प्रयास की समझ
- GPT 4.5 pre-training scaling laws को समझने की दिशा में एक महत्वपूर्ण प्रयास था
- यह science में योगदान देने वाला एक उपहार है

xguru 2025-02-28

GPT-4.5 की कीमत (प्रति 1M tokens)

input के लिए $75
cached input $37.50
output के लिए $150
अगर 4o से कीमत की तुलना करें तो input 30 गुना, output 15 गुना महंगा है

लेकिन performance उतनी बेहतर नहीं हुई है, इसलिए लगता है काफी असंतोष है

कहा जा रहा है कि Cursor में GPT-4.5 इस्तेमाल करके देखें तो यह उन cases में भी efficiently काम करता है जहाँ दूसरे models fail हो जाते हैं.
बेशक यह बहुत महंगा है, इसलिए usage-based भुगतान करना पड़ता है. इस पर प्रतिक्रिया भी है, "जटिल coding कराते-कराते दिवालिया हो जाएंगे"
https://x.com/cursor_ai/status/1895210110714290302

bearmett 2025-02-28

Claude Code की कीमत देखते हुए मुझे भी कुछ ऐसा ही लगा था। अगर आप नौकरीपेशा हैं, तो क्या प्रति घंटा कमाई से ज़्यादा खर्च होना दिवालिया होने जैसा नहीं है? 😵‍💫

botplaysdice 2025-02-28

लगता है यह अच्छी बात है। मॉडल की कीमत के हिसाब से हमारी वैल्यू भी...;;;