6 पॉइंट द्वारा GN⁺ 2024-07-25 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Mistral Large 2 128k context window और फ़्रेंच, जर्मन, स्पैनिश, इटालियन, चीनी, जापानी और कोरियाई सहित कई भाषाओं को सपोर्ट करता है
    • साथ ही यह Python, Java, C, C++, JavaScript, Bash सहित 80 से अधिक coding languages को सपोर्ट करता है
  • इसे single-node inference के लिए डिज़ाइन किया गया है, और यह 123 अरब parameters से बना है, जिससे single node पर high throughput मिल सकता है
  • इसे Mistral Research License के तहत वितरित किया गया है, जिसके अंतर्गत research और non-commercial उपयोग के लिए इसका इस्तेमाल और modification किया जा सकता है। commercial उपयोग के लिए Mistral Commercial License प्राप्त करना होगा

सामान्य प्रदर्शन

  • Mistral Large 2 performance/cost evaluation metrics में नया benchmark स्थापित करता है
  • खास तौर पर MMLU में इसका pre-trained version 84.0% accuracy हासिल करता है, और performance/cost Pareto front पर एक नया बिंदु स्थापित करता है

कोड और reasoning

  • Codestral 22B और Codestral Mamba के अनुभव के आधार पर Mistral Large 2 को बड़ी मात्रा में code पर train किया गया है
  • Mistral Large 2, पिछले Mistral Large की तुलना में कहीं बेहतर है और GPT-4o, Claude 3 Opus, Llama 3 405B जैसे leading models के बराबर प्रदर्शन दिखाता है
  • मॉडल की reasoning क्षमता को बेहतर बनाने के लिए काफ़ी प्रयास किए गए हैं, और factually incorrect जानकारी बनाने की प्रवृत्ति को न्यूनतम करने के लिए मॉडल को fine-tune किया गया है
  • मॉडल को इस तरह train किया गया है कि जब उसे समाधान न मिले या पर्याप्त जानकारी न हो, तो वह इसे स्वीकार करे

निर्देश पालन और alignment

  • Mistral Large 2 में instruction following और conversation क्षमता में काफ़ी सुधार हुआ है
  • क्योंकि कई business applications में संक्षिप्तता महत्वपूर्ण होती है, इसलिए इसे यथासंभव संक्षिप्त और सारगर्भित उत्तर देने के लिए काफ़ी मेहनत से तैयार किया गया है

भाषा विविधता

  • Mistral Large 2 को बड़े पैमाने पर multilingual data पर train किया गया है, इसलिए यह अंग्रेज़ी, फ़्रेंच, जर्मन, स्पैनिश, इटालियन, पुर्तगाली, डच, रूसी, चीनी, जापानी, कोरियाई, अरबी और हिंदी में उत्कृष्ट प्रदर्शन दिखाता है

टूल उपयोग और function calling

  • Mistral Large 2 में बेहतर function calling और retrieval capabilities हैं, और इसे complex business applications के power engine के रूप में काम करने के लिए train किया गया है

cloud service providers के माध्यम से Mistral मॉडल एक्सेस

  • Google Cloud Platform के साथ partnership का विस्तार करते हुए Vertex AI पर Mistral AI के models उपलब्ध कराए गए हैं
  • Azure AI Studio, Amazon Bedrock, IBM watsonx.ai पर भी Mistral AI के models उपलब्ध हैं

GN⁺ का सार

  • Mistral Large 2 कई भाषाओं और coding languages को सपोर्ट करता है और single node पर high throughput प्रदान करता है।
  • इसकी code generation और reasoning क्षमता में बड़ा सुधार हुआ है, और factually incorrect जानकारी बनाने की प्रवृत्ति को न्यूनतम किया गया है।
  • बड़े पैमाने के multilingual data पर training के कारण यह कई भाषाओं में उत्कृष्ट प्रदर्शन दिखाता है।
  • Google Cloud Platform, Azure AI Studio, Amazon Bedrock, IBM watsonx.ai के साथ partnership के ज़रिये इसे वैश्विक उपयोगकर्ताओं तक पहुँचाया जा रहा है।
  • इसे business applications में संक्षिप्त और सारगर्भित उत्तर देने के लिए डिज़ाइन किया गया है।

1 टिप्पणियां

 
GN⁺ 2024-07-25
Hacker News राय
  • Mistral Large 2 और Llama 3.1 405b मॉडल का परीक्षण करने पर, दोनों मॉडलों के बीच स्पष्ट रूप से किसी एक को बेहतर कहना मुश्किल है
  • अगर आप Claude का उपयोग कर रहे हैं, तो उसे ही इस्तेमाल करते रहना बेहतर है
  • Claude से अपेक्षाएँ:
    • और स्मार्ट हो
    • लंबी context window (1M+)
    • native audio input और tone की समझ
    • इनकार करते समय नैतिक निर्णय कम करे
    • और तेज हो
    • output tokens की संख्या बढ़े
  • मॉडलों के बीच प्रतिस्पर्धा तेज होती जा रही है
  • Claude 3.5 Sonnet बाकी सभी मॉडलों पर भारी पड़ता है
  • समझ नहीं आता कि Mistral या Llama को रोज़मर्रा में कैसे इस्तेमाल किया जाए
  • AI coding assistant विकसित कर रहा हूँ, और कई मॉडल आज़माने के बाद Mistral Large 2 सबसे निराशाजनक लगा
  • non-commercial license निराशाजनक है
  • यह Llama 3.1 405b से टक्कर लेने लायक है, लेकिन इसका license अधिक प्रतिबंधित है
  • मॉडलों के बीच अंतर कम होता जा रहा है, इसलिए किसी खास use case के लिए Llama 405B को fine-tune करना बेहतर हो सकता है
  • जब तक quality में कोई बड़ी छलांग नहीं आती, मौजूदा स्थिति में बड़ा फर्क नहीं होगा
  • प्रतिस्पर्धा तेज होने से खुशी है
  • बहुत खर्च करके SOTA मॉडल बनाए जा रहे हैं, लेकिन वे अभी भी GPT-4o और Claude Opus के स्तर पर ही रुके हैं
  • सिर्फ data और GPU अधिक लगाने भर से सीमाएँ सामने आने लगी हैं
  • user experience और "व्यक्तित्व" अधिक महत्वपूर्ण हो जाएंगे
  • Claude Sonnet पसंद आ रहा है, और यह दूसरे मॉडलों की तुलना में अधिक sharp लगता है
  • यह नहीं भूलना चाहिए कि हर अगले चरण में और अधिक ऊर्जा व संसाधनों की ज़रूरत होती है
  • PyLLMs के हालिया मॉडल benchmark नतीजे साझा किए गए
    • Nemo की speed और quality देखकर हैरानी हुई
    • Mistral Large अच्छा है, लेकिन बहुत धीमा है
  • Claude मॉडलों में Opus और Sonnet 3.5 में से कौन अधिक सक्षम है, इसे लेकर भ्रम है
  • Mistral Large 2 में बेहतर function calling और retrieval क्षमताएँ हैं
  • यह सवाल है कि function calling accuracy लगभग 50% होने का मतलब क्या जटिल कामों में आधे प्रयास विफल हो जाते हैं
  • ChatGPT-4o को प्राथमिकता देता हूँ, और समस्या होने पर Claude का उपयोग करता हूँ, लेकिन बेहतर नतीजे नहीं मिलते