14 पॉइंट द्वारा xguru 2023-05-09 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • 1 ट्रिलियन tokens पर प्रशिक्षित Transformer
  • गुणवत्ता LLaMA-7B जैसी, लेकिन open source है और व्यावसायिक उपयोग के लिए उपलब्ध
  • अतिरिक्त रूप से 3 fine-tuned models भी जारी किए गए
    • MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (65K tokens support)
  • MosaicML platform पर लगभग 9.5 दिनों में करीब ~$200K लागत से train किया गया, और आप अपना स्वयं का MPT model train, fine-tune और deploy कर सकते हैं
  • MPT: Mosaic Pretrained Transformers

2 टिप्पणियां

 
kuroneko 2023-05-09

आजकल व्यावसायिक इस्तेमाल के लिए उपलब्ध open source LLM मॉडल जिस रफ्तार से लॉन्च हो रहे हैं,
उसे देखकर लगता है कि वे LLM दुनिया का Stable Diffusion बनने की होड़ में हैं।

देखने में दिलचस्प होगा कि आखिर विजेता कौन बनता है। +_+

 
xguru 2023-05-09

मुझे लगता है कि पहले ChatGPT के साथ इंटीग्रेशन करके डेवलपमेंट करना, और बाद में सबसे उन्नत open source मॉडल से उसे बदलना एक अच्छा विकल्प हो सकता है।