16 पॉइंट द्वारा xguru 2023-05-08 | 3 टिप्पणियां | WhatsApp पर शेयर करें
  • 80+ programming languages के लिए 1 ट्रिलियन tokens पर प्रशिक्षित 15.5B मॉडल
  • अधिक efficient generation के लिए MQA का उपयोग करता है, और 8192-token context window रखता है
    • StarCoderBase : 80 से अधिक languages के data वाला The-Stack v1.2 (6TB) dataset पर प्रशिक्षित
    • StarCoder : Python पर अतिरिक्त रूप से प्रशिक्षित मॉडल
  • Chat Demo और VSCode के लिए extension उपलब्ध

3 टिप्पणियां

 
ninebow 2023-05-08

यह Twitter की घोषणा पोस्ट में दिया गया पेपर लिंक है. :)

https://drive.google.com/file/d/1cN-b9GnWtHzQRoE7M7gAEyivY0kl4BYs/view

 
ninebow 2023-05-08

लगता है कि इसे HuggingFace Chat में सीधे इस्तेमाल करने के लिए भी उपलब्ध कराया गया है. :)
https://huggingface.co/chat/?model=bigcode/starcoder