24 पॉइंट द्वारा lemonmint 2025-03-19 | 9 टिप्पणियां | WhatsApp पर शेयर करें
  • LG AI Research द्वारा विकसित नया Reasoning AI मॉडल, EXAONE Deep पेश किया गया
  • Agentic AI युग में बदलाव के लिए आवश्यक उच्च-प्रदर्शन reasoning मॉडल
  • गणित, विज्ञान और coding क्षेत्रों में उत्कृष्ट reasoning क्षमता साबित
  • मुख्य विशेषताएँ:
    • गणित: उच्च-कठिनाई वाले गणित benchmarks में प्रतिस्पर्धी मॉडलों की तुलना में बेहतर प्रदर्शन (छोटे मॉडल आकार के साथ समान प्रदर्शन हासिल)
    • विज्ञान & Coding: प्रमुख benchmarks में पहला स्थान (7.8B और 2.4B मॉडल)
    • MMLU: घरेलू मॉडलों में सर्वोच्च प्रदर्शन (32B मॉडल)
  • Epoch AI के उल्लेखनीय AI मॉडलों में शामिल होकर प्रदर्शन सत्यापित हुआ (EXAONE 3.5 के बाद EXAONE मॉडल के रूप में दूसरा)

गणित क्षेत्र में उत्कृष्ट प्रदर्शन

  • सभी EXAONE Deep मॉडल (32B, 7.8B, 2.4B) ने 2025 शैक्षणिक वर्ष के College Scholastic Ability Test के गणित खंड में सर्वोच्च अंक हासिल किए
  • EXAONE Deep 32B:
    • CSAT गणित में 94.5 अंक, AIME 2024 में 90.0 अंक दर्ज
    • AIME 2025 में DeepSeek-R1 (671B) मॉडल के बराबर प्रदर्शन
    • विशेष रूप से उच्च-कठिनाई benchmark AIME में शानदार प्रदर्शन दिखाते हुए training efficiency और cost efficiency साबित की
  • EXAONE Deep 7.8B & 2.4B:
    • प्रत्येक lightweight मॉडल और on-device मॉडल श्रेणी में प्रमुख benchmarks में पहला स्थान
    • 7.8B मॉडल: MATH-500 94.8 अंक, AIME 2025 59.6 अंक
    • 2.4B मॉडल: MATH-500 92.3 अंक, AIME 2024 47.9 अंक
  • प्रमुख गणित benchmarks:
    • CSAT (College Scholastic Ability Test)
    • AIME (American Invitational Mathematics Examination)
    • MATH-500

विज्ञान और coding क्षेत्र में उत्कृष्ट विशेषज्ञता

  • विज्ञान और coding क्षेत्रों में भी प्रतिस्पर्धी मॉडलों की तुलना में बेहतर प्रदर्शन साबित
  • EXAONE Deep 32B:
    • GPQA Diamond टेस्ट में 66.1 अंक (PhD-स्तर के विज्ञान प्रश्न हल करने की क्षमता का मूल्यांकन)
    • LiveCodeBench में 59.5 अंक (coding क्षमता का मूल्यांकन), समान आकार के Reasoning AI मॉडलों से बेहतर
    • यह संकेत देता है कि विशेषज्ञ ज्ञान की आवश्यकता वाले क्षेत्रों में भी इसका उपयोग संभव है
  • EXAONE Deep 7.8B & 2.4B:
    • GPQA Diamond और LiveCodeBench में पहला स्थान हासिल
    • EXAONE 3.5 2.4B मॉडल के बाद lightweight/on-device मॉडल क्षेत्र में वैश्विक अग्रणी मॉडल के रूप में स्थापित
  • प्रमुख विज्ञान और coding benchmarks:
    • GPQA Diamond
    • LiveCodeBench

9 टिप्पणियां

 
sice81 2025-03-20

वाह, LG को समर्थन देता हूँ। क्या LLM के मामले में यह लगभग हमारे देश का सबसे बेहतरीन नहीं है? सुना है कि इसे आंतरिक सिस्टम में भी काफ़ी अच्छी तरह इस्तेमाल किया जा रहा है... लेकिन लाइसेंस थोड़ा निराशाजनक है। अच्छा होगा कि नया वर्ज़न आने पर पुराने वर्ज़न को MIT के तहत जारी कर दें।

 
mindok 2025-03-19

नोटबुक पर लोकल में चलाने के लिए EXAONE 3.5 भी ठीक था, इसलिए इससे काफ़ी उम्मीदें हैं।

 
bungker 2025-03-19

यह काफ़ी चौंकाने वाला था। लगा था बस media play के लिए है, लेकिन इतने conservative LG ने ऐसा कुछ निकाला और उसे public भी कर दिया..

 
halfenif 2025-03-20

मैंने जो लाइसेंस देखा, उसे लेकर यह जिज्ञासा है कि इसका उपयोग कैसे किया जा सकता है।

  1. Restrictions
    3.1 Commercial Use: The Licensee is expressly prohibited from using the Model, Derivatives, or Output for
    any commercial purposes, including but not limited to, developing or deploying products, services, or
    applications that generate revenue, whether directly or indirectly.

3.1 वाणिज्यिक उपयोग: लाइसेंसी को प्रत्यक्ष या अप्रत्यक्ष रूप से राजस्व उत्पन्न करने वाले उत्पादों, सेवाओं या एप्लिकेशन के विकास या परिनियोजन सहित, Model, Derivatives या Output का किसी भी वाणिज्यिक उद्देश्य के लिए उपयोग करने से स्पष्ट रूप से प्रतिबंधित किया जाता है।

  1. Ownership
    4.2 Output: All rights, title, and interest in and to the Output generated by the Model and Derivatives
    whether in its original form or modified, are and shall remain the exclusive property of the Licensor.

4.2 आउटपुट: मूल रूप में हो या संशोधित रूप में, Model और Derivatives द्वारा उत्पन्न Output से संबंधित सभी अधिकार, स्वामित्व और हित Licensor की विशिष्ट संपत्ति हैं और बने रहेंगे।

 
yosemite 2025-03-20

हाँ। यह ऐसी लाइसेंस है जिसमें commercial use की अनुमति नहीं है। इसलिए मैं इसे अपने विचार के दायरे से बाहर रखता हूँ।

 
junia3 2025-03-19

मैंने इसे सर्वर पर इंस्टॉल करके इस्तेमाल किया, लेकिन qwq की तुलना में think समय बहुत ज़्यादा लंबा हो जाता है.
सही जवाब कितने अच्छे से देता है यह तो पता नहीं, लेकिन latency उम्मीद से ज़्यादा गंभीर लगती है.

 
junia3 2025-03-19

लगता है ऐसा सिर्फ कुछ समस्याओं के साथ ही था। कुछ और चलाकर तुलना की, तो वे भी लगभग समान परिणाम देते दिखते हैं

 
nowdoit7 2025-03-19

समर्थन करता हूँ~ LG~फाइटिंग~

 
jujumilk3 2025-03-19

समर्थन करता हूँ। LinkedIn पर जहाँ-जहाँ यह दिखता है, वहाँ-वहाँ मैं like दबा रहा हूँ।