OpenAI ने GPT-OSS मॉडल सीरीज़ (gpt-oss-120b / gpt-oss-20b) को Apache 2.0 लाइसेंस के तहत अचानक सार्वजनिक कर दिया है। GPT-2 के बाद 6 साल में पहली बार आया यह ओपन-वेट मॉडल प्रदर्शन और दक्षता दोनों में बाज़ार का संतुलन बदल देने की क्षमता रखता है.

🧠 प्रमुख विशेषताएँ

  • 20B मॉडल: Mixture of Experts(MoE) संरचना
     • 128 experts में से 4 सक्रिय → प्रदर्शन बनाए रखते हुए inference लागत कम
     • FlashAttention, 128k token सपोर्ट, YaRN शामिल
  • 20B मॉडल: 16GB GPU वातावरण में भी चल सकता है (Apple Silicon सहित)

📊 प्रमुख benchmark प्रदर्शन (GPT-OSS-120B के आधार पर)

  • MMLU: 90.0% (o4-mini के समान)
  • AIME गणित: 97.9% (गणित+tool उपयोग में शीर्ष स्तर)
  • Codeforces Elo: 2622 (coding क्षमता भी ऊपरी स्तर की)
  • HealthBench: GPT-4o की तुलना में बेहतर प्रदर्शन
  • MMMLU (14 भाषाएँ): 81.3% → बहुभाषी reasoning भी मजबूत

💡 उपयोगिता & ecosystem

  • एकल H100 80GB GPU पर 120B मॉडल चलाया जा सकता है
  • 16GB वातावरण में भी 20B मॉडल real-time में चल सकता है
  • HuggingFace, vLLM, Ollama आदि के साथ तुरंत compatible

🔐 सुरक्षा & ज़िम्मेदारी

  • RL-आधारित reasoning consistency को मजबूत किया गया
  • Deliberative Alignment लागू
  • जानबूझकर दुरुपयोग की स्थिति में भी high-risk output उत्पन्न नहीं करता

लगता है कुछ समय तक इसे ClosedAI कहकर चिढ़ाना मुश्किल होगा। थोड़ी देर टेस्ट किया, हिंदी भी काफ़ी अच्छी है.

https://huggingface.co/openai/gpt-oss-120b

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.