OpenAI ने ज़्यादा सोचकर जवाब देने वाले o1 मॉडल का प्रीव्यू जारी किया

xguru · 2024-09-13T08:50:46+09:00

जटिल समस्याओं को हल करने के लिए नया reasoning मॉडल मॉडल को इस तरह प्रशिक्षित किया गया है कि वह जवाब देने से पहले समस्या पर अधिक देर तक सोचे प्रशिक्षण के माध्यम से इसने अपनी thought process को बेहतर बनाना, अलग-अलग strategies आज़माना, और गलतियों को पहचानना सीखा physics, chemistry और biology के चुनौतीपूर्ण benchmark tasks में इसने PhD छात्रों के समान प्रदर्शन दिखाया math और coding में भी उत्कृष्ट प्रदर्शन International Mathematical Olympiad (IMO) क्वालिफाइंग परीक्षा में GPT-4o ने केवल 13% प्रश्न सही किए, जबकि reasoning मॉडल ने 83% सही किए Codeforces प्रतियोगिताओं में coding क्षमता 89वें percentile तक पहुँची सुरक्षा safety training के लिए नया approach तैयार किया गया ताकि मॉडल safety और alignment guidelines का पालन करे सबसे कठिन jailbreak tests में से एक में GPT-4o को 22 अंक (100 में से) मिले, जबकि o1-preview मॉडल को 84 अंक मिले safety tasks, internal governance और federal government collaboration को मज़बूत किया गया Preparedness Framework का उपयोग करके सख्त testing और evaluation highest-level red teaming operations Safety & Security Committee सहित board-level review process अमेरिका और ब्रिटेन के AI Safety Institutes के साथ समझौते किए गए और संचालन शुरू किया गया यह मॉडल किनके लिए है science, coding और math जैसे क्षेत्रों में जटिल समस्याओं से निपटने के लिए यह विशेष रूप से उपयोगी हो सकता है उदाहरण के लिए healthcare researchers cell sequencing data पर annotation कर सकते हैं, physicists quantum optics के लिए आवश्यक जटिल mathematical formulas बना सकते हैं, developers multi-step workflows बनाने और चलाने में इसका उपयोग कर सकते हैं OpenAI o1-mini o1 series जटिल code को सटीक रूप से generate और debug करने में उत्कृष्ट है developers को अधिक efficient solution देने के लिए o1-mini नाम का तेज़ और सस्ता reasoning मॉडल भी जारी किया गया o1-mini, o1-preview की तुलना में 80% सस्ता है उन applications के लिए एक शक्तिशाली और cost-effective मॉडल जिन्हें reasoning की ज़रूरत है, लेकिन व्यापक world knowledge की नहीं OpenAI o1 का उपयोग कैसे करें ChatGPT Plus और Team उपयोगकर्ता आज से ChatGPT में o1 मॉडल का उपयोग कर सकते हैं o1-preview और o1-mini दोनों को manually चुना जा सकता है लॉन्च के समय o1-preview पर प्रति सप्ताह 30 और o1-mini पर प्रति सप्ताह 50 messages की सीमा है ChatGPT Enterprise और Edu उपयोगकर्ता अगले सप्ताह से दोनों मॉडलों का उपयोग कर सकेंगे API usage tier 5 के developers आज से 20 RPM की rate limit के साथ API में दोनों मॉडलों पर prototyping शुरू कर सकते हैं इन मॉडलों के API में अभी function calling, streaming और system messages support जैसी सुविधाएँ शामिल नहीं हैं सभी ChatGPT Free उपयोगकर्ताओं को o1-mini access देने की योजना है आगे की योजना यह ChatGPT और API के लिए reasoning मॉडल का शुरुआती preview है model updates के अलावा browsing, file और image upload जैसी सुविधाएँ जोड़कर इसे सभी के लिए अधिक उपयोगी बनाने की योजना है नई OpenAI o1 series के साथ GPT series के मॉडल development और release को जारी रखने की योजना है

(openai.com)

8 पॉइंट द्वारा xguru 2024-09-13 | 4 टिप्पणियां | WhatsApp पर शेयर करें

जटिल समस्याओं को हल करने के लिए नया reasoning मॉडल
मॉडल को इस तरह प्रशिक्षित किया गया है कि वह जवाब देने से पहले समस्या पर अधिक देर तक सोचे
प्रशिक्षण के माध्यम से इसने अपनी thought process को बेहतर बनाना, अलग-अलग strategies आज़माना, और गलतियों को पहचानना सीखा
physics, chemistry और biology के चुनौतीपूर्ण benchmark tasks में इसने PhD छात्रों के समान प्रदर्शन दिखाया
math और coding में भी उत्कृष्ट प्रदर्शन
- International Mathematical Olympiad (IMO) क्वालिफाइंग परीक्षा में GPT-4o ने केवल 13% प्रश्न सही किए, जबकि reasoning मॉडल ने 83% सही किए
- Codeforces प्रतियोगिताओं में coding क्षमता 89वें percentile तक पहुँची

सुरक्षा

safety training के लिए नया approach तैयार किया गया ताकि मॉडल safety और alignment guidelines का पालन करे
सबसे कठिन jailbreak tests में से एक में GPT-4o को 22 अंक (100 में से) मिले, जबकि o1-preview मॉडल को 84 अंक मिले
safety tasks, internal governance और federal government collaboration को मज़बूत किया गया
- Preparedness Framework का उपयोग करके सख्त testing और evaluation
- highest-level red teaming operations
- Safety & Security Committee सहित board-level review process
अमेरिका और ब्रिटेन के AI Safety Institutes के साथ समझौते किए गए और संचालन शुरू किया गया

यह मॉडल किनके लिए है

science, coding और math जैसे क्षेत्रों में जटिल समस्याओं से निपटने के लिए यह विशेष रूप से उपयोगी हो सकता है
उदाहरण के लिए
- healthcare researchers cell sequencing data पर annotation कर सकते हैं,
- physicists quantum optics के लिए आवश्यक जटिल mathematical formulas बना सकते हैं,
- developers multi-step workflows बनाने और चलाने में इसका उपयोग कर सकते हैं

OpenAI o1-mini

o1 series जटिल code को सटीक रूप से generate और debug करने में उत्कृष्ट है
developers को अधिक efficient solution देने के लिए o1-mini नाम का तेज़ और सस्ता reasoning मॉडल भी जारी किया गया
o1-mini, o1-preview की तुलना में 80% सस्ता है
- उन applications के लिए एक शक्तिशाली और cost-effective मॉडल जिन्हें reasoning की ज़रूरत है, लेकिन व्यापक world knowledge की नहीं

OpenAI o1 का उपयोग कैसे करें

ChatGPT Plus और Team उपयोगकर्ता आज से ChatGPT में o1 मॉडल का उपयोग कर सकते हैं
o1-preview और o1-mini दोनों को manually चुना जा सकता है
लॉन्च के समय o1-preview पर प्रति सप्ताह 30 और o1-mini पर प्रति सप्ताह 50 messages की सीमा है
ChatGPT Enterprise और Edu उपयोगकर्ता अगले सप्ताह से दोनों मॉडलों का उपयोग कर सकेंगे
API usage tier 5 के developers आज से 20 RPM की rate limit के साथ API में दोनों मॉडलों पर prototyping शुरू कर सकते हैं
इन मॉडलों के API में अभी function calling, streaming और system messages support जैसी सुविधाएँ शामिल नहीं हैं
सभी ChatGPT Free उपयोगकर्ताओं को o1-mini access देने की योजना है

आगे की योजना

यह ChatGPT और API के लिए reasoning मॉडल का शुरुआती preview है
model updates के अलावा browsing, file और image upload जैसी सुविधाएँ जोड़कर इसे सभी के लिए अधिक उपयोगी बनाने की योजना है
नई OpenAI o1 series के साथ GPT series के मॉडल development और release को जारी रखने की योजना है

4 टिप्पणियां

dbs0829 2024-09-13

GitHub Copilot के साथ इसकी synergy कैसी होगी, यह जानने की जिज्ञासा है।

wedding 2024-09-13

क्या यही वह चर्चित स्ट्रॉबेरी है?

brainer 2024-09-13

हाँ। Altman ने उस अफ़वाह को फैलाने वाले व्यक्ति को सांत्वना दी थी।

xguru 2024-09-13

शायद सही है। लगता है कि सिर्फ़ reasoning पर फोकस करने के लिए उन्होंने नए version number के तौर पर 1 चुना है।