- जटिल समस्याओं को हल करने के लिए नया reasoning मॉडल
- मॉडल को इस तरह प्रशिक्षित किया गया है कि वह जवाब देने से पहले समस्या पर अधिक देर तक सोचे
- प्रशिक्षण के माध्यम से इसने अपनी thought process को बेहतर बनाना, अलग-अलग strategies आज़माना, और गलतियों को पहचानना सीखा
- physics, chemistry और biology के चुनौतीपूर्ण benchmark tasks में इसने PhD छात्रों के समान प्रदर्शन दिखाया
- math और coding में भी उत्कृष्ट प्रदर्शन
- International Mathematical Olympiad (IMO) क्वालिफाइंग परीक्षा में GPT-4o ने केवल 13% प्रश्न सही किए, जबकि reasoning मॉडल ने 83% सही किए
- Codeforces प्रतियोगिताओं में coding क्षमता 89वें percentile तक पहुँची
सुरक्षा
- safety training के लिए नया approach तैयार किया गया ताकि मॉडल safety और alignment guidelines का पालन करे
- सबसे कठिन jailbreak tests में से एक में GPT-4o को 22 अंक (100 में से) मिले, जबकि o1-preview मॉडल को 84 अंक मिले
- safety tasks, internal governance और federal government collaboration को मज़बूत किया गया
- Preparedness Framework का उपयोग करके सख्त testing और evaluation
- highest-level red teaming operations
- Safety & Security Committee सहित board-level review process
- अमेरिका और ब्रिटेन के AI Safety Institutes के साथ समझौते किए गए और संचालन शुरू किया गया
यह मॉडल किनके लिए है
- science, coding और math जैसे क्षेत्रों में जटिल समस्याओं से निपटने के लिए यह विशेष रूप से उपयोगी हो सकता है
- उदाहरण के लिए
- healthcare researchers cell sequencing data पर annotation कर सकते हैं,
- physicists quantum optics के लिए आवश्यक जटिल mathematical formulas बना सकते हैं,
- developers multi-step workflows बनाने और चलाने में इसका उपयोग कर सकते हैं
OpenAI o1-mini
- o1 series जटिल code को सटीक रूप से generate और debug करने में उत्कृष्ट है
- developers को अधिक efficient solution देने के लिए o1-mini नाम का तेज़ और सस्ता reasoning मॉडल भी जारी किया गया
- o1-mini, o1-preview की तुलना में 80% सस्ता है
- उन applications के लिए एक शक्तिशाली और cost-effective मॉडल जिन्हें reasoning की ज़रूरत है, लेकिन व्यापक world knowledge की नहीं
OpenAI o1 का उपयोग कैसे करें
- ChatGPT Plus और Team उपयोगकर्ता आज से ChatGPT में o1 मॉडल का उपयोग कर सकते हैं
- o1-preview और o1-mini दोनों को manually चुना जा सकता है
- लॉन्च के समय o1-preview पर प्रति सप्ताह 30 और o1-mini पर प्रति सप्ताह 50 messages की सीमा है
- ChatGPT Enterprise और Edu उपयोगकर्ता अगले सप्ताह से दोनों मॉडलों का उपयोग कर सकेंगे
- API usage tier 5 के developers आज से 20 RPM की rate limit के साथ API में दोनों मॉडलों पर prototyping शुरू कर सकते हैं
- इन मॉडलों के API में अभी function calling, streaming और system messages support जैसी सुविधाएँ शामिल नहीं हैं
- सभी ChatGPT Free उपयोगकर्ताओं को o1-mini access देने की योजना है
आगे की योजना
- यह ChatGPT और API के लिए reasoning मॉडल का शुरुआती preview है
- model updates के अलावा browsing, file और image upload जैसी सुविधाएँ जोड़कर इसे सभी के लिए अधिक उपयोगी बनाने की योजना है
- नई OpenAI o1 series के साथ GPT series के मॉडल development और release को जारी रखने की योजना है
4 टिप्पणियां
GitHub Copilot के साथ इसकी synergy कैसी होगी, यह जानने की जिज्ञासा है।
क्या यही वह चर्चित स्ट्रॉबेरी है?
हाँ। Altman ने उस अफ़वाह को फैलाने वाले व्यक्ति को सांत्वना दी थी।
शायद सही है। लगता है कि सिर्फ़ reasoning पर फोकस करने के लिए उन्होंने नए version number के तौर पर 1 चुना है।