OpenAI ने 6 साल बाद ओपन सोर्स LLM, GPT-OSS पेश किया
(openai.com)OpenAI ने GPT-OSS मॉडल सीरीज़ (gpt-oss-120b / gpt-oss-20b) को Apache 2.0 लाइसेंस के तहत अचानक सार्वजनिक कर दिया है। GPT-2 के बाद 6 साल में पहली बार आया यह ओपन-वेट मॉडल प्रदर्शन और दक्षता दोनों में बाज़ार का संतुलन बदल देने की क्षमता रखता है.
🧠 प्रमुख विशेषताएँ
- 20B मॉडल: Mixture of Experts(MoE) संरचना
• 128 experts में से 4 सक्रिय → प्रदर्शन बनाए रखते हुए inference लागत कम
• FlashAttention, 128k token सपोर्ट, YaRN शामिल - 20B मॉडल: 16GB GPU वातावरण में भी चल सकता है (Apple Silicon सहित)
📊 प्रमुख benchmark प्रदर्शन (GPT-OSS-120B के आधार पर)
- MMLU: 90.0% (o4-mini के समान)
- AIME गणित: 97.9% (गणित+tool उपयोग में शीर्ष स्तर)
- Codeforces Elo: 2622 (coding क्षमता भी ऊपरी स्तर की)
- HealthBench: GPT-4o की तुलना में बेहतर प्रदर्शन
- MMMLU (14 भाषाएँ): 81.3% → बहुभाषी reasoning भी मजबूत
💡 उपयोगिता & ecosystem
- एकल H100 80GB GPU पर 120B मॉडल चलाया जा सकता है
- 16GB वातावरण में भी 20B मॉडल real-time में चल सकता है
- HuggingFace, vLLM, Ollama आदि के साथ तुरंत compatible
🔐 सुरक्षा & ज़िम्मेदारी
- RL-आधारित reasoning consistency को मजबूत किया गया
- Deliberative Alignment लागू
- जानबूझकर दुरुपयोग की स्थिति में भी high-risk output उत्पन्न नहीं करता
लगता है कुछ समय तक इसे ClosedAI कहकर चिढ़ाना मुश्किल होगा। थोड़ी देर टेस्ट किया, हिंदी भी काफ़ी अच्छी है.
8 टिप्पणियां
120b मॉडल का simpleqa स्कोर भी 0.168 है।
मैंने इसे vllm से serve करने की कोशिश की, लेकिन यह Flash Attention3-आधारित है इसलिए सिर्फ Hopper को ही support करता है, इसलिए अफसोस।
मैं भी इसलिए ollama का इस्तेमाल करता हूँ…
अब लगभग अप्रासंगिक हो चुका A100...
संबंधित Hacker News टिप्पणियों के लिए OpenAI, बड़े पैमाने का ओपन-वेट भाषा मॉडल जारी पोस्ट देखें.
आप परफ़ॉर्मेंस के बारे में विभिन्न मूल्यांकन देख सकते हैं.
जब मुझे यह जानना हो कि मेरा कंप्यूटर धीमा है... तो सोचता हूँ कि उसी prompt के साथ सेकंड सीधे नापकर टेस्ट करके देखूँ तो कैसा रहेगा। ^^; शायद एक साधारण रिकॉर्ड रखने के लिए Google Spreadsheet भी खोलकर रखना चाहूँगा/चाहूँगी (सिर्फ रिकॉर्ड रखने के मज़े के लिए)
MXFP4 quantization के जरिए इसे Ollama में 16GB मेमोरी (VRAM) वाले सिस्टम पर भी चलाया जा सकता है (gpt-oss:20b): https://ollama.com/blog/gpt-oss
जो लोग बड़ा मॉडल चलाना चाहते हैं, वे इस बार लॉन्च किया गया $20/माह वाला ollama turbo इस्तेमाल कर सकते हैं: https://ollama.com/turbo