- OpenAI ने पहली बार बड़े ओपन-वेट भाषा मॉडल (gpt-oss) जारी किए
- gpt-oss-120b और gpt-oss-20b दो मॉडल उपलब्ध हैं, जो मजबूत परफॉर्मेंस और विविध डिवाइस सपोर्ट पर ज़ोर देते हैं
- Apache 2.0 लाइसेंस के साथ, व्यावसायिक उपयोग, कस्टमाइज़ेशन और स्वतंत्र वितरण संभव है
- सुरक्षा के लिए प्रशिक्षण तथा बाहरी सुरक्षा विशेषज्ञों द्वारा समीक्षा और व्यापक सुरक्षा परीक्षण प्रक्रिया लागू की गई
- Hugging Face, GitHub आदि से मॉडल सीधे डाउनलोड करके उपयोग किए जा सकते हैं; फाइन-ट्यूनिंग, तैनाती और कस्टमाइज़ेशन से जुड़े संसाधन और Playground भी उपलब्ध हैं
OpenAI का ओपन मॉडल
- OpenAI ने सभी उपयोग मामलों में कस्टमाइज़ किया जा सकने वाला और कहीं भी रन किया जा सकने वाला बड़ा ओपन-वेट इनफरेंस मॉडल (gpt-oss) जारी किया
- Hugging Face और GitHub से मॉडल फाइलों को सीधे डाउनलोड किया जा सकता है, और वेब-बेस्ड Playground के जरिए डेमो भी अनुभव किए जा सकते हैं
- Apache 2.0 लाइसेंस पर रिलीज़ किए गए ये मॉडल, बिना copyleft या पेटेंट उल्लंघन की चिंता के, स्वतंत्र रूप से व्यावसायिक उपयोग, कस्टमाइज़ेशन, और डिप्लॉयमेंट की सुविधा देते हैं
- gpt-oss-120b: डेटा सेंटर, हाई-पर्फॉर्मेंस डेस्कटॉप और लैपटॉप के लिए बड़ा मॉडल
- gpt-oss-20b: ज़्यादातर डेस्कटॉप और लैपटॉप पर चलने वाला मिडियम मॉडल
मुख्य विशेषताएँ
-
एजेंट वर्क के लिए ऑप्टिमाइज़ेशन
- टूल उपयोग और निर्देशों का पालन इसकी ताकत है, इसलिए यह वेब सर्च, Python कोड रनिंग जैसे एजेंट-आधारित कार्यों के लिए उपयुक्त है
-
कस्टमाइज़ेशन और फाइन-ट्यूनिंग
- reasoning_effort (तर्क कठिनाई) जैसे हाइपरपैरामीटर को समायोजित किया जा सकता है
- फुल-पैरामीटर फाइन-ट्यूनिंग के जरिए एडवांस्ड कस्टमाइज़ेशन का समर्थन
-
Chain-of-Thought का एक्सपोज़र
- मॉडल का पूरा तर्क-प्रक्रिया प्रवाह (thinking flow) देखा जा सकता है, जिससे debugging और ट्रस्ट मूल्यांकन आसान होता है
-
Playground उपलब्धता
- किसी भी डेवलपर या रिसर्चर के लिए ब्राउज़र से मॉडल परफॉर्मेंस ट्राय करने के लिए Playground उपलब्ध है
मॉडल परफॉर्मेंस
- gpt-oss-120b और gpt-oss-20b का OpenAI के व्यावसायिक मॉडल्स (OpenAI o3, o4-mini) के साथ कई प्रमुख benchmarks पर सीधे तुलना की गई है
- प्रत्येक मॉडल के reasoning, knowledge, competitive math जैसे अलग-अलग क्षेत्रों के scores/रिज़ल्ट्स सार्वजनिक रूप से दिए गए हैं
- कुछ श्रेणियों में ये OpenAI के व्यावसायिक मॉडलों के करीब हैं, जबकि कुछ टेस्ट में बेहतर परिणाम दिखाते हैं
प्रमुख बेंचमार्क प्रदर्शन विवरण
-
तर्क और ज्ञान
- MMLU (Massive Multitask Language Understanding)
- gpt-oss-120b: 90
- gpt-oss-20b: 85.3
- OpenAI o3: 93.4
- OpenAI o4-mini: 93
- → बड़े व्यावसायिक मॉडल से कुछ नीचे रहने के बावजूद, ओपन मॉडल कैटेगरी में यह बहुत मजबूत समग्र reasoning प्रदर्शन देता है
- GPQA Diamond
- gpt-oss-120b: 80.9
- gpt-oss-20b: 74.2
- OpenAI o3: 77
- OpenAI o4-mini: 81.4
- → ओपन मॉडल होने के बावजूद, यह व्यावसायिक मॉडल्स के करीब का हाई-लेवल नॉलेज-आधारित QA performance देता है
- Humanity’s Last Exam
- gpt-oss-120b: 19
- gpt-oss-20b: 17.3
- OpenAI o3: 24.9
- OpenAI o4-mini: 17.7
- → कठोर टेस्ट में व्यावसायिक मॉडल से स्कोर कुछ कम है, लेकिन 20b और o4-mini लगभग समान परिणाम देते हैं
-
प्रतिस्पर्धी गणित (AIME)
- AIME 2024
- gpt-oss-120b: 96.6
- gpt-oss-20b: 96
- OpenAI o3: 91.6
- OpenAI o4-mini: 93.4
- → 2024 संस्करण के हिसाब से ये स्कोर व्यावसायिक मॉडल्स से भी ऊपर हैं
- AIME 2025
- gpt-oss-120b: 97.9
- gpt-oss-20b: 98.7
- OpenAI o3: 88.9
- OpenAI o4-mini: 92.7
- → गणित में OpenAI के व्यावसायिक मॉडल्स को पीछे छोड़ने वाले आँकड़े भी दिखते हैं
-
समेकित व्याख्या
- gpt-oss श्रृंखला ने विशेष रूप से गणित, लॉजिक और नॉलेज क्षेत्रों में मजबूत प्रदर्शन दिखाया है
- व्यावसायिक मॉडल्स से गैप बहुत ज्यादा नहीं है, इसलिए रीयल-टाइम प्रोडक्शन या इंजीनियरिंग ऐप्स में उपयोग की संभावना अच्छी है
- बड़े ओपन मॉडल के रूप में शोध-विकास, एजेंट और कस्टमाइज़ेशन सेटअप के लिए यह एक प्रतिस्पर्धी विकल्प है
सुरक्षा और टेस्टिंग
- सभी मॉडल पर कठोर सुरक्षा प्रशिक्षण और मूल्यांकन लागू किए गए हैं
- OpenAI के readiness framework के तहत malicious fine-tuning के प्रति resilience अलग से टेस्ट की गई है
- बाहरी सुरक्षा विशेषज्ञों के साथ मिलकर ओपन मॉडलों के लिए सुरक्षा मानक स्थापित किए गए हैं
अभी कोई टिप्पणी नहीं है.