- Mistral ने Pixtral 12B पेश किया, जो उसका पहला ऐसा मॉडल है जो इमेज और टेक्स्ट दोनों को प्रोसेस कर सकता है
- 12 billion parameters वाला लगभग 24GB आकार का मॉडल
- यह Mistral के टेक्स्ट मॉडल Nemo 12B के आधार पर बनाया गया है
- URL या base64-encoded इमेज के जरिए किसी भी संख्या और आकार की इमेज पर सवालों के जवाब दे सकता है
- उम्मीद है कि यह Anthropic के Claude family या OpenAI के GPT-4 जैसे अन्य मल्टीमॉडल मॉडलों की तरह image captioning, फोटो में ऑब्जेक्ट गिनना जैसे काम कर सकेगा
- GitHub और Hugging Face पर torrent link के जरिए डाउनलोड के लिए उपलब्ध है
- Apache 2.0 license के तहत बिना किसी प्रतिबंध के डाउनलोड, fine-tuning और उपयोग संभव है
- फिलहाल web demo काम नहीं कर रहा है, लेकिन जल्द ही Mistral के chatbot और API service platform Le Chat और Le Plateforme पर इसे टेस्ट किया जा सकेगा
- हाल ही में Mistral ने General Catalyst की अगुवाई वाले $645 million funding round को बंद किया, जिसमें कंपनी का valuation $6 billion आंका गया
- करीब एक साल पुरानी Mistral में Microsoft की अल्पांश हिस्सेदारी है, और इसे यूरोप का OpenAI माना जाता है
- कंपनी free "open" models जारी करने, managed versions के लिए शुल्क लेने, और enterprise ग्राहकों को consulting services देने की रणनीति अपना रही है
अभी कोई टिप्पणी नहीं है.