• OpenAI ने पहली बार बड़े ओपन-वेट भाषा मॉडल (gpt-oss) जारी किए
  • gpt-oss-120b और gpt-oss-20b दो मॉडल उपलब्ध हैं, जो मजबूत परफॉर्मेंस और विविध डिवाइस सपोर्ट पर ज़ोर देते हैं
  • Apache 2.0 लाइसेंस के साथ, व्यावसायिक उपयोग, कस्टमाइज़ेशन और स्वतंत्र वितरण संभव है
  • सुरक्षा के लिए प्रशिक्षण तथा बाहरी सुरक्षा विशेषज्ञों द्वारा समीक्षा और व्यापक सुरक्षा परीक्षण प्रक्रिया लागू की गई
  • Hugging Face, GitHub आदि से मॉडल सीधे डाउनलोड करके उपयोग किए जा सकते हैं; फाइन-ट्यूनिंग, तैनाती और कस्टमाइज़ेशन से जुड़े संसाधन और Playground भी उपलब्ध हैं

OpenAI का ओपन मॉडल

  • OpenAI ने सभी उपयोग मामलों में कस्टमाइज़ किया जा सकने वाला और कहीं भी रन किया जा सकने वाला बड़ा ओपन-वेट इनफरेंस मॉडल (gpt-oss) जारी किया
  • Hugging Face और GitHub से मॉडल फाइलों को सीधे डाउनलोड किया जा सकता है, और वेब-बेस्ड Playground के जरिए डेमो भी अनुभव किए जा सकते हैं
  • Apache 2.0 लाइसेंस पर रिलीज़ किए गए ये मॉडल, बिना copyleft या पेटेंट उल्लंघन की चिंता के, स्वतंत्र रूप से व्यावसायिक उपयोग, कस्टमाइज़ेशन, और डिप्लॉयमेंट की सुविधा देते हैं
  • gpt-oss-120b: डेटा सेंटर, हाई-पर्फॉर्मेंस डेस्कटॉप और लैपटॉप के लिए बड़ा मॉडल
  • gpt-oss-20b: ज़्यादातर डेस्कटॉप और लैपटॉप पर चलने वाला मिडियम मॉडल

मुख्य विशेषताएँ

  • एजेंट वर्क के लिए ऑप्टिमाइज़ेशन

    • टूल उपयोग और निर्देशों का पालन इसकी ताकत है, इसलिए यह वेब सर्च, Python कोड रनिंग जैसे एजेंट-आधारित कार्यों के लिए उपयुक्त है
  • कस्टमाइज़ेशन और फाइन-ट्यूनिंग

    • reasoning_effort (तर्क कठिनाई) जैसे हाइपरपैरामीटर को समायोजित किया जा सकता है
    • फुल-पैरामीटर फाइन-ट्यूनिंग के जरिए एडवांस्ड कस्टमाइज़ेशन का समर्थन
  • Chain-of-Thought का एक्सपोज़र

    • मॉडल का पूरा तर्क-प्रक्रिया प्रवाह (thinking flow) देखा जा सकता है, जिससे debugging और ट्रस्ट मूल्यांकन आसान होता है
  • Playground उपलब्धता

    • किसी भी डेवलपर या रिसर्चर के लिए ब्राउज़र से मॉडल परफॉर्मेंस ट्राय करने के लिए Playground उपलब्ध है

मॉडल परफॉर्मेंस

  • gpt-oss-120b और gpt-oss-20b का OpenAI के व्यावसायिक मॉडल्स (OpenAI o3, o4-mini) के साथ कई प्रमुख benchmarks पर सीधे तुलना की गई है
  • प्रत्येक मॉडल के reasoning, knowledge, competitive math जैसे अलग-अलग क्षेत्रों के scores/रिज़ल्ट्स सार्वजनिक रूप से दिए गए हैं
  • कुछ श्रेणियों में ये OpenAI के व्यावसायिक मॉडलों के करीब हैं, जबकि कुछ टेस्ट में बेहतर परिणाम दिखाते हैं

प्रमुख बेंचमार्क प्रदर्शन विवरण

  • तर्क और ज्ञान

    • MMLU (Massive Multitask Language Understanding)
      • gpt-oss-120b: 90
      • gpt-oss-20b: 85.3
      • OpenAI o3: 93.4
      • OpenAI o4-mini: 93
      • → बड़े व्यावसायिक मॉडल से कुछ नीचे रहने के बावजूद, ओपन मॉडल कैटेगरी में यह बहुत मजबूत समग्र reasoning प्रदर्शन देता है
    • GPQA Diamond
      • gpt-oss-120b: 80.9
      • gpt-oss-20b: 74.2
      • OpenAI o3: 77
      • OpenAI o4-mini: 81.4
      • → ओपन मॉडल होने के बावजूद, यह व्यावसायिक मॉडल्स के करीब का हाई-लेवल नॉलेज-आधारित QA performance देता है
    • Humanity’s Last Exam
      • gpt-oss-120b: 19
      • gpt-oss-20b: 17.3
      • OpenAI o3: 24.9
      • OpenAI o4-mini: 17.7
      • → कठोर टेस्ट में व्यावसायिक मॉडल से स्कोर कुछ कम है, लेकिन 20b और o4-mini लगभग समान परिणाम देते हैं
  • प्रतिस्पर्धी गणित (AIME)

    • AIME 2024
      • gpt-oss-120b: 96.6
      • gpt-oss-20b: 96
      • OpenAI o3: 91.6
      • OpenAI o4-mini: 93.4
      • 2024 संस्करण के हिसाब से ये स्कोर व्यावसायिक मॉडल्स से भी ऊपर हैं
    • AIME 2025
      • gpt-oss-120b: 97.9
      • gpt-oss-20b: 98.7
      • OpenAI o3: 88.9
      • OpenAI o4-mini: 92.7
      • गणित में OpenAI के व्यावसायिक मॉडल्स को पीछे छोड़ने वाले आँकड़े भी दिखते हैं
  • समेकित व्याख्या

    • gpt-oss श्रृंखला ने विशेष रूप से गणित, लॉजिक और नॉलेज क्षेत्रों में मजबूत प्रदर्शन दिखाया है
    • व्यावसायिक मॉडल्स से गैप बहुत ज्यादा नहीं है, इसलिए रीयल-टाइम प्रोडक्शन या इंजीनियरिंग ऐप्स में उपयोग की संभावना अच्छी है
    • बड़े ओपन मॉडल के रूप में शोध-विकास, एजेंट और कस्टमाइज़ेशन सेटअप के लिए यह एक प्रतिस्पर्धी विकल्प है

सुरक्षा और टेस्टिंग

  • सभी मॉडल पर कठोर सुरक्षा प्रशिक्षण और मूल्यांकन लागू किए गए हैं
  • OpenAI के readiness framework के तहत malicious fine-tuning के प्रति resilience अलग से टेस्ट की गई है
  • बाहरी सुरक्षा विशेषज्ञों के साथ मिलकर ओपन मॉडलों के लिए सुरक्षा मानक स्थापित किए गए हैं
  • Hugging Face और GitHub पर मॉडल डाउनलोड और उपयोग किया जा सकता है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.