• Stanford Alpaca 7B/13B पर आधारित, डेवलपर्स के लिए coding tasks में उपयोग के अनुकूल ट्यून किया गया मॉडल
  • कोड जनरेशन से संबंधित 20K Instruction Following डेटा से प्रतिस्थापित (Self-Instruct तकनीक का उपयोग)
  • डेटा जनरेशन pipeline में आंशिक बदलाव: prompts को सामान्य कार्यों के बजाय code generation/editing/optimization से संबंधित बनाया गया
  • Hugging Face training code और Deepspeed के साथ fine-tuning

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.