• पहली पीढ़ी का मल्टीमोडल मॉडल Grok-1.5V अब अपनी शक्तिशाली टेक्स्ट क्षमताओं के साथ-साथ दस्तावेज़, डायग्राम, चार्ट, स्क्रीनशॉट और फ़ोटो सहित व्यापक विज़ुअल जानकारी को प्रोसेस कर सकता है.
• Grok-1.5V बहु-विषयी रीजनिंग, दस्तावेज़ समझ, वैज्ञानिक डायग्राम, चार्ट, स्क्रीनशॉट और फ़ोटो जैसे विभिन्न क्षेत्रों में मौजूदा मल्टीमोडल मॉडलों से बेहतर प्रदर्शन करता है और भौतिक दुनिया को समझने में उत्कृष्ट क्षमता दिखाता है.
• प्रश्नों और आसानी से सत्यापित किए जा सकने वाले उत्तरों वाली 700 से अधिक इमेजों से बना नया बेंचमार्क RealWorldQA पेश किया गया है, ताकि मल्टीमोडल मॉडलों की बुनियादी वास्तविक-स्थान समझ क्षमता का मूल्यांकन किया जा सके.
• Grok-1.5V जल्द ही शुरुआती टेस्टर्स और मौजूदा Grok उपयोगकर्ताओं के लिए उपलब्ध होगा, और इमेज, ऑडियो तथा वीडियो जैसी विभिन्न modalities में इसकी मल्टीमोडल क्षमताओं का सक्रिय रूप से विस्तार किया जा रहा है.
अभी कोई टिप्पणी नहीं है.