DeepSpeed Chat - RLHF का उपयोग करके ChatGPT-जैसे मॉडल को train करने के लिए framework
(github.com/microsoft)- तेज़, कम लागत वाला और scalable open source system framework
- End-to-End RLHF(Reinforcement Learning Human Feedback) के माध्यम से किसी भी scale पर high-quality ChatGPT style models बनाए जा सकते हैं
- 1-क्लिक में 48GB मेमोरी वाले एक NVIDIA A6000 GPU पर 1.3B parameter ChatGPT model को 1.36 घंटे के भीतर train, generate और serve किया जा सकता है
- Databricks Dolly, CarperAI-TRLX, Huggingface-PEFT आदि इसका उपयोग कर रहे हैं
1 टिप्पणियां
DeepSpeed - MS द्वारा जारी deep learning optimization library
Databricks ने ChatGPT जैसी Dolly 2.0 को open source के रूप में जारी किया