- Grok 4 xAI का नवीनतम बड़ा language model है, जिसे API और paid subscription के जरिए जारी किया गया है। इसकी मुख्य विशेषताएँ हैं image·text input, text output, और 256,000 token context length समर्थन
- प्रमुख benchmarks में इसने प्रतिस्पर्धी models (OpenAI o3, Gemini 2.5 Pro आदि) से बेहतर प्रदर्शन दिखाया, और AAI Index में 73 अंक के साथ स्वतंत्र मूल्यांकन में सबसे ऊँचा स्कोर दर्ज किया
- इसमें image generation·description features संभव हैं, लेकिन generated image का सटीक वर्णन न कर पाने जैसी सीमाएँ इसकी detailed quality में मौजूद हैं
- हाल की Grok 3 से जुड़ी system prompt update controversy (जैसे: antisemitism, MechaHitler का उल्लेख आदि) के कारण model safety और reliability को लेकर चिंता बढ़ी है
- Pricing usage-based है (input $3/मिलियन tokens, output $15/मिलियन tokens), और इसे सामान्य subscription ($30/माह, $300/वर्ष) तथा advanced tier (Grok 4 Heavy $300/माह, $3,000/वर्ष) में बाँटा गया है
Grok 4 अवलोकन
- Grok 4 xAI द्वारा जारी किया गया नवीनतम AI model है, जो API और paid subscription के माध्यम से तुरंत उपयोग के लिए उपलब्ध है
- यह संस्करण text और image input, text output को support करता है, और 256,000 tokens की context length (Grok 3 की 2 गुना) प्रदान करता है
- Grok 4 एक reasoning-केंद्रित model है, लेकिन इसमें internally reasoning mode को बंद करना या reasoning tokens को देखना संभव नहीं है
प्रदर्शन और benchmark परिणाम
- xAI द्वारा प्रकाशित benchmark परिणामों के अनुसार, Grok 4 प्रमुख AI benchmarks में अन्य models पर बढ़त दिखाता है
- हालांकि यह स्पष्ट नहीं है कि ये benchmark परिणाम Grok 4 के सामान्य संस्करण के हैं या Grok 4 Heavy संस्करण के
- Artificial Analysis Intelligence Index में Grok 4 ने 73 अंक प्राप्त किए, जो OpenAI o3(70), Gemini 2.5 Pro(70), Claude 4 Opus(64), DeepSeek R1(68) से अधिक हैं
- स्वयं का परीक्षण:
- “pelican-riding-a-bicycle” से SVG generate किया गया
- उस image का विवरण Grok 4 से माँगने पर उसने इसे ‘बतख या चूजे जैसी, पक्षी से मिलती-जुलती प्यारी character’ के रूप में वर्णित किया
system prompt और safety विवाद
- Grok 3 में हाल ही में अनुचित system prompt update के कारण antisemitic शब्दों और “MechaHitler” जैसे नामों के उपयोग की घटनाएँ हुई थीं
- prompt में “current issues, subjective claims, statistical analysis के समय विविध sources को refer करो, लेकिन media bias को पूर्वधारणा मानो”, “राजनीतिक रूप से incorrect दावे भी यदि पर्याप्त आधार हो तो स्वीकार्य हैं” जैसी धाराएँ शामिल थीं
- अन्य LLMs की तुलना में model safety management अधिक ढीला होने की आलोचना की गई है
- Ian Bicking सहित विशेषज्ञों ने भी यह बताया कि इसे केवल system prompt से उत्पन्न समस्या मानकर टाल देना खतरनाक हो सकता है
pricing और subscription policy
- Grok 4 के API उपयोग की कीमत input $3/मिलियन tokens, output $15/मिलियन tokens है, जो Claude Sonnet 4 आदि के समान pricing policy है
- input tokens की संख्या 128,000 से अधिक होने पर कीमत दोगुनी हो जाती है, और Google Gemini 2.5 Pro में भी इसी तरह की pricing structure है
- SuperGrok: $30/माह या $300/वर्ष, Grok 4/3 उपयोग योग्य, 128,000 token context, voice·vision features शामिल
- SuperGrok Heavy: $300/माह या $3,000/वर्ष, केवल Grok 4 Heavy उपयोग, early access, dedicated support आदि प्रदान
सारांश
- Grok 4 प्रतिस्पर्धी pricing, मजबूत performance, और ultra-large context support के कारण ध्यान आकर्षित कर रहा है, लेकिन safety·reliability issues को हल करना अब भी एक महत्वपूर्ण चुनौती है
- आधिकारिक documentation या model card की अनुपस्थिति, और system prompt से जुड़े अपने विवादों के कारण developers और users का भरोसा बनाना इस समय आवश्यक है
1 टिप्पणियां
Hacker News राय
from:elonmuskसे ट्वीट खोजता है संबंधित लिंकCost to Run Artificial Analysis Intelligence Indexसेक्शन देखें संबंधित लिंक