- GPT-4.5 OpenAI का नवीनतम मॉडल है, जो pre-training और post-training में scalability को बेहतर बनाने वाला संस्करण है
- unsupervised learning के scale को बढ़ाकर pattern recognition और creative insight को मजबूत किया गया है
- अब अधिक स्वाभाविक बातचीत संभव है, यह user intent को बेहतर समझता है और emotional intelligence (EQ) भी बेहतर हुई है
- writing, programming, problem solving जैसे कई तरह के कामों में उपयोगी है
- hallucination की दर कम होने की उम्मीद है
- इसे research preview के रूप में उपलब्ध कराया गया है, ताकि मॉडल की ताकत और सीमाओं को समझा जा सके और विभिन्न use cases इकट्ठा किए जा सकें
बिना पर्यवेक्षण वाले शिक्षण का विस्तार
- AI की प्रगति के लिए unsupervised learning और reasoning के दो अक्षों का विस्तार किया जा रहा है
- reasoning को मजबूत करना: जटिल STEM समस्याओं को हल करने के लिए मॉडल को व्यवस्थित तरीके से सोचने के लिए प्रशिक्षित किया गया है
- OpenAI o1, OpenAI o3-mini जैसे मॉडल इस approach को आगे बढ़ाते हैं
- unsupervised learning का विस्तार: अधिक डेटा के जरिए मॉडल की intuition और world knowledge की accuracy बढ़ाई जाती है
- GPT-4.5 को Microsoft Azure AI सुपरकंप्यूटर पर प्रशिक्षित किया गया है, और इसमें अधिक व्यापक ज्ञान व गहरी समझ है
- इससे hallucination कम होती है और अलग-अलग विषयों पर अधिक भरोसेमंद परिणाम मिलते हैं
GPT प्रतिमान का विस्तार
- GPT-4.5 के पास पिछले मॉडलों की तुलना में बेहतर knowledge है
- भाषा की उत्पत्ति जैसे ऐतिहासिक प्रश्नों पर यह अधिक गहरी insight देता है
- "पहली भाषा क्या थी?" जैसे सवाल पर:
- संभव है कि कोई एकमात्र पहली भाषा कभी रही ही न हो
- अनुमान है कि भाषा अफ्रीका में 1 लाख वर्ष से भी पहले उभरी होगी
- proto-languages संभवतः gestures, sounds और signals से विकसित हुई होंगी
- लिखित अभिलेख न होने के कारण भाषा की सटीक उत्पत्ति पता नहीं लगाई जा सकती
- इस तरह GPT-4.5 linguistics और history जैसे क्षेत्रों में भी गहराई वाले उत्तर दे सकता है
अधिक गहरा विश्व ज्ञान
- SimpleQA evaluation results में GPT-4.5 ने अन्य मॉडलों की तुलना में अधिक accuracy दर्ज की
- Accuracy तुलना:
- GPT-4.5: 62.5%
- GPT-4o: 38.2%
- OpenAI o1: 47%
- OpenAI o3-mini: 15%
- Hallucination Rate तुलना (कम होना बेहतर है):
- GPT-4.5: 37.1%
- GPT-4o: 61.8%
- OpenAI o1: 44%
- OpenAI o3-mini: 80.3%
- GPT-4.5 fact-checking की जरूरत वाले सवालों में अधिक accuracy बनाए रखता है और hallucination rate को कम करता है
मनुष्यों के साथ सहयोग के लिए प्रशिक्षण
- GPT-4.5 को मानव की जरूरतों और इरादों को बेहतर समझने के लिए प्रशिक्षित किया गया है
- यह user intent को अधिक सूक्ष्मता से समझता है और अधिक natural conversation संभव बनाता है
- पिछले मॉडलों की तुलना में emotional intelligence (EQ) बेहतर हुई है, इसलिए यह सूक्ष्म nuances को बेहतर समझता है
- writing और design कार्यों में इसकी creative intuition और aesthetic sense बेहतर है
- तुलनात्मक मूल्यांकन (Win-rate vs GPT-4o)
- creative tasks: 56.8%
- professional questions: 63.2%
- everyday questions: 57.0%
- GPT-4.5 इंसानों के साथ सहयोग को अधिक स्वाभाविक रूप से कर सकता है और बातचीत के दौरान user intent को अधिक सटीकता से समझता है
आगे की दिशा: अधिक शक्तिशाली तर्क क्षमता
- GPT-4.5 ऐसा मॉडल नहीं है जो उत्तर देने से पहले तार्किक रूप से सोचता हो
- यह OpenAI o1 और OpenAI o3-mini जैसे reasoning-केंद्रित मॉडलों से अलग approach अपनाता है
- भविष्य के मॉडलों में pre-training और reasoning के संयोजन को प्रमुख दिशा माना जा रहा है
सुरक्षा सुदृढ़ीकरण
- GPT-4.5 को नई supervision techniques के साथ प्रशिक्षित किया गया है, जिनमें मौजूदा SFT (supervised fine-tuning) और RLHF (reinforcement learning from human feedback) शामिल हैं
- मॉडल को deploy करने से पहले safety tests किए गए ताकि संभावित जोखिमों का आकलन किया जा सके
- मूल्यांकन परिणामों वाली system card प्रकाशित की गई है, ताकि research और feedback को बढ़ावा दिया जा सके
ChatGPT में GPT-4.5 उपयोग करने का तरीका
- आज से ChatGPT Pro users वेब, मोबाइल और डेस्कटॉप पर GPT-4.5 चुन सकते हैं
- अगले सप्ताह Plus और Team users के लिए उपलब्ध कराया जाएगा
- उसके अगले सप्ताह Enterprise और Edu users के लिए उपलब्ध कराया जाएगा
- मुख्य सुविधाएँ:
- नवीनतम जानकारी खोजने की क्षमता
- files और images upload का समर्थन
- canvas का उपयोग करके writing और coding कार्य संभव
- हालांकि, voice mode, video और screen sharing features समर्थित नहीं हैं
API में GPT-4.5 उपयोग करने का तरीका
- Chat Completions API, Assistants API, Batch API के जरिए developers को उपलब्ध कराया जा रहा है
- मुख्य सुविधाएँ:
- Function Calling
- Structured Outputs
- Streaming
- System Messages
- image input के जरिए vision capabilities का समर्थन
- developers के उपयोग के उदाहरण:
- ऐसे applications जहाँ emotional intelligence और creativity महत्वपूर्ण हैं (जैसे writing assistant, learning coaching, brainstorming)
- जटिल code tasks (जैसे multi-step coding workflows, automation)
- API उपलब्धता से जुड़े विचार:
- GPT-4.5 एक high-compute और high-cost मॉडल है, इसलिए यह GPT-4o को replace नहीं करता
- इसे API में लंबे समय तक उपलब्ध रखा जाए या नहीं, इस पर विचार चल रहा है, और user feedback महत्वपूर्ण है
निष्कर्ष
- GPT-4.5 unsupervised learning की सीमाओं का विस्तार करने वाला मॉडल है, जो creative और नए features को explore करने में मदद कर सकता है
- यह AI तकनीक की नई संभावनाओं की खोज करता है, और users के innovative use cases की अपेक्षा करता है.
4 टिप्पणियां
Hacker News टिप्पणियाँ
GPT 4.5 की कीमत बहुत अधिक है
GPT-4.5 इस्तेमाल करने का अनुभव
emotional intelligence (EQ) पर फ़ोकस
ब्लॉग पोस्ट और live stream demo से निराशा
OpenAI और Anthropic के अलग-अलग दृष्टिकोण
Kagi LLM benchmark में GPT-4.5 का प्रदर्शन
API के माध्यम से GPT-4.5 इस्तेमाल करने का तरीका
coding performance की तुलना
OpenAI के इस प्रयास की समझ
GPT-4.5 की कीमत (प्रति 1M tokens)
अगर 4o से कीमत की तुलना करें तो input 30 गुना, output 15 गुना महंगा है
लेकिन performance उतनी बेहतर नहीं हुई है, इसलिए लगता है काफी असंतोष है
कहा जा रहा है कि Cursor में GPT-4.5 इस्तेमाल करके देखें तो यह उन cases में भी efficiently काम करता है जहाँ दूसरे models fail हो जाते हैं.
बेशक यह बहुत महंगा है, इसलिए usage-based भुगतान करना पड़ता है. इस पर प्रतिक्रिया भी है, "जटिल coding कराते-कराते दिवालिया हो जाएंगे"
https://x.com/cursor_ai/status/1895210110714290302
Claude Code की कीमत देखते हुए मुझे भी कुछ ऐसा ही लगा था। अगर आप नौकरीपेशा हैं, तो क्या प्रति घंटा कमाई से ज़्यादा खर्च होना दिवालिया होने जैसा नहीं है? 😵💫
लगता है यह अच्छी बात है। मॉडल की कीमत के हिसाब से हमारी वैल्यू भी...;;;