Code Alpaca - कोड जनरेशन निर्देशों पर प्रशिक्षित LLaMA
(github.com/sahil280114)- Stanford Alpaca 7B/13B पर आधारित, डेवलपर्स के लिए coding tasks में उपयोग के अनुकूल ट्यून किया गया मॉडल
- कोड जनरेशन से संबंधित 20K Instruction Following डेटा से प्रतिस्थापित (Self-Instruct तकनीक का उपयोग)
- डेटा जनरेशन pipeline में आंशिक बदलाव: prompts को सामान्य कार्यों के बजाय code generation/editing/optimization से संबंधित बनाया गया
- Hugging Face training code और Deepspeed के साथ fine-tuning
अभी कोई टिप्पणी नहीं है.