StarCoder, BigCode प्रोजेक्ट द्वारा जारी किया गया code LLM
(huggingface.co)- 80+ programming languages के लिए 1 ट्रिलियन tokens पर प्रशिक्षित 15.5B मॉडल
- अधिक efficient generation के लिए MQA का उपयोग करता है, और 8192-token context window रखता है
- StarCoderBase : 80 से अधिक languages के data वाला The-Stack v1.2 (6TB) dataset पर प्रशिक्षित
- StarCoder : Python पर अतिरिक्त रूप से प्रशिक्षित मॉडल
- Chat Demo और VSCode के लिए extension उपलब्ध
3 टिप्पणियां
यह Twitter की घोषणा पोस्ट में दिया गया पेपर लिंक है. :)
https://drive.google.com/file/d/1cN-b9GnWtHzQRoE7M7gAEyivY0kl4BYs/view
लगता है कि इसे HuggingFace Chat में सीधे इस्तेमाल करने के लिए भी उपलब्ध कराया गया है. :)
https://huggingface.co/chat/?model=bigcode/starcoder
SantaCoder - 1.1B पैरामीटर्स के साथ प्रशिक्षित code generation model