OpenAI ने 6 साल बाद ओपन सोर्स LLM, GPT-OSS पेश किया
(openai.com)OpenAI ने GPT-OSS मॉडल सीरीज़ (gpt-oss-120b / gpt-oss-20b) को Apache 2.0 लाइसेंस के तहत अचानक सार्वजनिक कर दिया है। GPT-2 के बाद 6 साल में पहली बार आया यह ओपन-वेट मॉडल प्रदर्शन और दक्षता दोनों में बाज़ार का संतुलन बदल देने की क्षमता रखता है.
🧠 प्रमुख विशेषताएँ
- 20B मॉडल: Mixture of Experts(MoE) संरचना
• 128 experts में से 4 सक्रिय → प्रदर्शन बनाए रखते हुए inference लागत कम
• FlashAttention, 128k token सपोर्ट, YaRN शामिल - 20B मॉडल: 16GB GPU वातावरण में भी चल सकता है (Apple Silicon सहित)
📊 प्रमुख benchmark प्रदर्शन (GPT-OSS-120B के आधार पर)
- MMLU: 90.0% (o4-mini के समान)
- AIME गणित: 97.9% (गणित+tool उपयोग में शीर्ष स्तर)
- Codeforces Elo: 2622 (coding क्षमता भी ऊपरी स्तर की)
- HealthBench: GPT-4o की तुलना में बेहतर प्रदर्शन
- MMMLU (14 भाषाएँ): 81.3% → बहुभाषी reasoning भी मजबूत
💡 उपयोगिता & ecosystem
- एकल H100 80GB GPU पर 120B मॉडल चलाया जा सकता है
- 16GB वातावरण में भी 20B मॉडल real-time में चल सकता है
- HuggingFace, vLLM, Ollama आदि के साथ तुरंत compatible
🔐 सुरक्षा & ज़िम्मेदारी
- RL-आधारित reasoning consistency को मजबूत किया गया
- Deliberative Alignment लागू
- जानबूझकर दुरुपयोग की स्थिति में भी high-risk output उत्पन्न नहीं करता
लगता है कुछ समय तक इसे ClosedAI कहकर चिढ़ाना मुश्किल होगा। थोड़ी देर टेस्ट किया, हिंदी भी काफ़ी अच्छी है.
अभी कोई टिप्पणी नहीं है.