SantaCoder - 1.1B पैरामीटर्स पर प्रशिक्षित कोड जनरेशन मॉडल
(huggingface.co)- Python, Java, Javascript कोड पर प्रशिक्षित मल्टीलिंगुअल language model
- LTR generation और infilling में Facebook के InCoder(6.7B) / Salesforce के CodeGen-Multi (2.7B) से बेहतर बताया गया
- BigCode द्वारा जारी The-Stack v1.1(6TB) dataset के एक हिस्से का उपयोग
2 टिप्पणियां
अभी AI प्रोजेक्ट्स parameter performance के दम पर बहुत ज़ोर लगा रहे हैं, लेकिन यह जानने की जिज्ञासा है कि profitability सुनिश्चित करने के लिए pricing आखिर कितनी रखनी होगी। CoPilot की तरह क्या वाकई $10 प्रति माह में लागत निकल पाएगी... (हालांकि मुझे पता है कि बड़ी कंपनियों की चिंता करना बेकार की बात है...)
GitHub का CoPilot 12B है, लेकिन कहा जा रहा है कि generated code की quality के मामले में उससे थोड़ा फर्क है।