OpenAI ने सबसे किफायती छोटा मॉडल GPT-4o mini पेश किया

xguru · 2024-07-19T11:52:11+09:00

GPT-4o mini से AI को पहले की तुलना में कहीं अधिक सस्ता बनाने की उम्मीद है, जिससे AI-आधारित एप्लिकेशनों का दायरा काफी बढ़ेगा इसने MMLU में 82% स्कोर किया है और वर्तमान LMSYS leaderboard में chat preference के मामले में GPT-4 को पीछे छोड़ता है कीमत input token के प्रति 10 लाख पर 15 सेंट और output token के प्रति 10 लाख पर 60 सेंट है, जो पिछले state-of-the-art मॉडल की तुलना में 10 गुना सस्ती और GPT-3.5 Turbo से 60% से अधिक सस्ती है GPT-4o mini की मुख्य विशेषताएँ कम लागत और कम latency के साथ व्यापक तरह के काम कर सकता है ऐसे एप्लिकेशनों के लिए उपयुक्त है जो कई model calls को जोड़ते या parallelize करते हैं, जैसे कई API calls ऐसे एप्लिकेशनों के लिए उपयुक्त है जो मॉडल को बहुत अधिक context भेजते हैं, जैसे पूरा code base या conversation history ऐसे एप्लिकेशनों के लिए उपयुक्त है जो ग्राहकों के साथ तेज़ और real-time text responses का आदान-प्रदान करते हैं, जैसे customer support chatbot API में text और vision को support करता है, और आगे चलकर text, image, video और audio input/output को support करेगा इसमें 128K token का context window है, प्रति request अधिकतम 16K output tokens को support करता है, और अक्टूबर 2023 तक का ज्ञान रखता है GPT-4o के साथ साझा किए गए बेहतर tokenizer की बदौलत अंग्रेज़ी के अलावा अन्य भाषाओं के text को प्रोसेस करना भी अधिक किफायती हो गया है GPT-4o mini का बेहतरीन प्रदर्शन GPT-4o mini text intelligence और multimodal reasoning दोनों में GPT-3.5 Turbo और अन्य छोटे मॉडलों से बेहतर है यह GPT-4o के समान language coverage को support करता है function calling में इसका प्रदर्शन उत्कृष्ट है, जिससे डेवलपर्स ऐसे एप्लिकेशन बना सकते हैं जो external systems से data लाएँ या कार्य निष्पादित करें GPT-3.5 Turbo की तुलना में long-context performance बेहतर हुई है इसने MMLU में 82.0%, MGSM में 87.0%, HumanEval में 87.2% और MMMU में 59.4% स्कोर किया, जो अन्य छोटे मॉडलों से बेहतर प्रदर्शन दिखाता है सुरक्षा उपाय pre-training के दौरान उन जानकारियों को filter किया जाता है जिन्हें मॉडल को सीखना या output नहीं करना चाहिए, जैसे hate speech, adult content, मुख्य रूप से personal information इकट्ठा करने वाली साइटें, spam आदि post-training में reinforcement learning from human feedback (RLHF) जैसी तकनीकों का उपयोग कर मॉडल के व्यवहार को नीतियों के अनुरूप समायोजित किया जाता है, जिससे मॉडल responses की सटीकता और विश्वसनीयता बेहतर होती है GPT-4o mini में GPT-4o जैसी ही built-in safety mitigations शामिल हैं 70 से अधिक बाहरी विशेषज्ञों ने GPT-4o का परीक्षण कर संभावित जोखिमों की पहचान की, उनका समाधान किया गया, और इन्हें GPT-4o system card तथा preparedness scorecard में विस्तार से साझा किया जाएगा GPT-4o mini API का पहला मॉडल है जिसमें instruction hierarchy method लागू किया गया है, ताकि jailbreak, prompt injection और system prompt extraction के प्रति मॉडल की प्रतिरोधक क्षमता बेहतर हो कीमत और उपलब्धता GPT-4o mini अब Assistants API, Chat Completions API और Batch API में text और vision मॉडल के रूप में उपलब्ध है डेवलपर्स input token के प्रति 10 लाख पर 15 सेंट और output token के प्रति 10 लाख पर 60 सेंट का भुगतान करेंगे आने वाले कुछ दिनों में GPT-4o mini के लिए fine-tuning जारी की जाएगी ChatGPT के free, Plus और Team उपयोगकर्ता आज से GPT-3.5 की जगह GPT-4o mini का उपयोग कर सकते हैं Enterprise उपयोगकर्ताओं को भी अगले सप्ताह से access मिलेगा आगे की योजना AI intelligence में उल्लेखनीय प्रगति के साथ-साथ लागत में भी बड़ा reduction हो रहा है GPT-4o mini की प्रति token लागत 2022 में पेश किए गए text-davinci-003 की तुलना में 99% कम है ऐसा भविष्य देखा जा रहा है जहाँ मॉडल हर app और website में सहज रूप से integrated हों GPT-4o mini डेवलपर्स के लिए शक्तिशाली AI एप्लिकेशन को अधिक दक्षता और कम लागत में बनाना और scale करना आसान बनाता है AI का भविष्य अधिक सुलभ, अधिक विश्वसनीय और हमारे रोज़मर्रा के digital अनुभवों में और गहराई से समाहित होता जा रहा है

(openai.com)

12 पॉइंट द्वारा xguru 2024-07-19 | 1 टिप्पणियां | WhatsApp पर शेयर करें

GPT-4o mini से AI को पहले की तुलना में कहीं अधिक सस्ता बनाने की उम्मीद है, जिससे AI-आधारित एप्लिकेशनों का दायरा काफी बढ़ेगा
इसने MMLU में 82% स्कोर किया है और वर्तमान LMSYS leaderboard में chat preference के मामले में GPT-4 को पीछे छोड़ता है
कीमत input token के प्रति 10 लाख पर 15 सेंट और output token के प्रति 10 लाख पर 60 सेंट है, जो पिछले state-of-the-art मॉडल की तुलना में 10 गुना सस्ती और GPT-3.5 Turbo से 60% से अधिक सस्ती है

GPT-4o mini की मुख्य विशेषताएँ

कम लागत और कम latency के साथ व्यापक तरह के काम कर सकता है
ऐसे एप्लिकेशनों के लिए उपयुक्त है जो कई model calls को जोड़ते या parallelize करते हैं, जैसे कई API calls
ऐसे एप्लिकेशनों के लिए उपयुक्त है जो मॉडल को बहुत अधिक context भेजते हैं, जैसे पूरा code base या conversation history
ऐसे एप्लिकेशनों के लिए उपयुक्त है जो ग्राहकों के साथ तेज़ और real-time text responses का आदान-प्रदान करते हैं, जैसे customer support chatbot
API में text और vision को support करता है, और आगे चलकर text, image, video और audio input/output को support करेगा
इसमें 128K token का context window है, प्रति request अधिकतम 16K output tokens को support करता है, और अक्टूबर 2023 तक का ज्ञान रखता है
GPT-4o के साथ साझा किए गए बेहतर tokenizer की बदौलत अंग्रेज़ी के अलावा अन्य भाषाओं के text को प्रोसेस करना भी अधिक किफायती हो गया है

GPT-4o mini का बेहतरीन प्रदर्शन

GPT-4o mini text intelligence और multimodal reasoning दोनों में GPT-3.5 Turbo और अन्य छोटे मॉडलों से बेहतर है
यह GPT-4o के समान language coverage को support करता है
function calling में इसका प्रदर्शन उत्कृष्ट है, जिससे डेवलपर्स ऐसे एप्लिकेशन बना सकते हैं जो external systems से data लाएँ या कार्य निष्पादित करें
GPT-3.5 Turbo की तुलना में long-context performance बेहतर हुई है
इसने MMLU में 82.0%, MGSM में 87.0%, HumanEval में 87.2% और MMMU में 59.4% स्कोर किया, जो अन्य छोटे मॉडलों से बेहतर प्रदर्शन दिखाता है

सुरक्षा उपाय

pre-training के दौरान उन जानकारियों को filter किया जाता है जिन्हें मॉडल को सीखना या output नहीं करना चाहिए, जैसे hate speech, adult content, मुख्य रूप से personal information इकट्ठा करने वाली साइटें, spam आदि
post-training में reinforcement learning from human feedback (RLHF) जैसी तकनीकों का उपयोग कर मॉडल के व्यवहार को नीतियों के अनुरूप समायोजित किया जाता है, जिससे मॉडल responses की सटीकता और विश्वसनीयता बेहतर होती है
GPT-4o mini में GPT-4o जैसी ही built-in safety mitigations शामिल हैं
70 से अधिक बाहरी विशेषज्ञों ने GPT-4o का परीक्षण कर संभावित जोखिमों की पहचान की, उनका समाधान किया गया, और इन्हें GPT-4o system card तथा preparedness scorecard में विस्तार से साझा किया जाएगा
GPT-4o mini API का पहला मॉडल है जिसमें instruction hierarchy method लागू किया गया है, ताकि jailbreak, prompt injection और system prompt extraction के प्रति मॉडल की प्रतिरोधक क्षमता बेहतर हो

कीमत और उपलब्धता

GPT-4o mini अब Assistants API, Chat Completions API और Batch API में text और vision मॉडल के रूप में उपलब्ध है
डेवलपर्स input token के प्रति 10 लाख पर 15 सेंट और output token के प्रति 10 लाख पर 60 सेंट का भुगतान करेंगे
आने वाले कुछ दिनों में GPT-4o mini के लिए fine-tuning जारी की जाएगी
ChatGPT के free, Plus और Team उपयोगकर्ता आज से GPT-3.5 की जगह GPT-4o mini का उपयोग कर सकते हैं
Enterprise उपयोगकर्ताओं को भी अगले सप्ताह से access मिलेगा

आगे की योजना

AI intelligence में उल्लेखनीय प्रगति के साथ-साथ लागत में भी बड़ा reduction हो रहा है
GPT-4o mini की प्रति token लागत 2022 में पेश किए गए text-davinci-003 की तुलना में 99% कम है
ऐसा भविष्य देखा जा रहा है जहाँ मॉडल हर app और website में सहज रूप से integrated हों
GPT-4o mini डेवलपर्स के लिए शक्तिशाली AI एप्लिकेशन को अधिक दक्षता और कम लागत में बनाना और scale करना आसान बनाता है
AI का भविष्य अधिक सुलभ, अधिक विश्वसनीय और हमारे रोज़मर्रा के digital अनुभवों में और गहराई से समाहित होता जा रहा है

1 टिप्पणियां

wedding 2024-07-22

लगता है gpt-4o pro max ultra भी आएगा।