31 पॉइंट द्वारा haebom 2025-08-06 | 8 टिप्पणियां | WhatsApp पर शेयर करें

OpenAI ने GPT-OSS मॉडल सीरीज़ (gpt-oss-120b / gpt-oss-20b) को Apache 2.0 लाइसेंस के तहत अचानक सार्वजनिक कर दिया है। GPT-2 के बाद 6 साल में पहली बार आया यह ओपन-वेट मॉडल प्रदर्शन और दक्षता दोनों में बाज़ार का संतुलन बदल देने की क्षमता रखता है.

🧠 प्रमुख विशेषताएँ

  • 20B मॉडल: Mixture of Experts(MoE) संरचना
     • 128 experts में से 4 सक्रिय → प्रदर्शन बनाए रखते हुए inference लागत कम
     • FlashAttention, 128k token सपोर्ट, YaRN शामिल
  • 20B मॉडल: 16GB GPU वातावरण में भी चल सकता है (Apple Silicon सहित)

📊 प्रमुख benchmark प्रदर्शन (GPT-OSS-120B के आधार पर)

  • MMLU: 90.0% (o4-mini के समान)
  • AIME गणित: 97.9% (गणित+tool उपयोग में शीर्ष स्तर)
  • Codeforces Elo: 2622 (coding क्षमता भी ऊपरी स्तर की)
  • HealthBench: GPT-4o की तुलना में बेहतर प्रदर्शन
  • MMMLU (14 भाषाएँ): 81.3% → बहुभाषी reasoning भी मजबूत

💡 उपयोगिता & ecosystem

  • एकल H100 80GB GPU पर 120B मॉडल चलाया जा सकता है
  • 16GB वातावरण में भी 20B मॉडल real-time में चल सकता है
  • HuggingFace, vLLM, Ollama आदि के साथ तुरंत compatible

🔐 सुरक्षा & ज़िम्मेदारी

  • RL-आधारित reasoning consistency को मजबूत किया गया
  • Deliberative Alignment लागू
  • जानबूझकर दुरुपयोग की स्थिति में भी high-risk output उत्पन्न नहीं करता

लगता है कुछ समय तक इसे ClosedAI कहकर चिढ़ाना मुश्किल होगा। थोड़ी देर टेस्ट किया, हिंदी भी काफ़ी अच्छी है.

https://huggingface.co/openai/gpt-oss-120b

8 टिप्पणियां

 
yeorinhieut 2025-08-06

120b मॉडल का simpleqa स्कोर भी 0.168 है।

 
jinucho 2025-08-06

मैंने इसे vllm से serve करने की कोशिश की, लेकिन यह Flash Attention3-आधारित है इसलिए सिर्फ Hopper को ही support करता है, इसलिए अफसोस।

 
yeorinhieut 2025-08-06

मैं भी इसलिए ollama का इस्तेमाल करता हूँ…

 
jinucho 2025-08-06

अब लगभग अप्रासंगिक हो चुका A100...

 
xguru 2025-08-06

संबंधित Hacker News टिप्पणियों के लिए OpenAI, बड़े पैमाने का ओपन-वेट भाषा मॉडल जारी पोस्ट देखें.
आप परफ़ॉर्मेंस के बारे में विभिन्न मूल्यांकन देख सकते हैं.

 
argo9 2025-08-06

जब मुझे यह जानना हो कि मेरा कंप्यूटर धीमा है... तो सोचता हूँ कि उसी prompt के साथ सेकंड सीधे नापकर टेस्ट करके देखूँ तो कैसा रहेगा। ^^; शायद एक साधारण रिकॉर्ड रखने के लिए Google Spreadsheet भी खोलकर रखना चाहूँगा/चाहूँगी (सिर्फ रिकॉर्ड रखने के मज़े के लिए)

 
fanotify 2025-08-06

MXFP4 quantization के जरिए इसे Ollama में 16GB मेमोरी (VRAM) वाले सिस्टम पर भी चलाया जा सकता है (gpt-oss:20b): https://ollama.com/blog/gpt-oss

 
fanotify 2025-08-06

जो लोग बड़ा मॉडल चलाना चाहते हैं, वे इस बार लॉन्च किया गया $20/माह वाला ollama turbo इस्तेमाल कर सकते हैं: https://ollama.com/turbo