DeepSpeed Chat - RLHF का उपयोग करके ChatGPT-जैसे मॉडल को train करने के लिए framework

xguru · 2023-04-17T10:26:01+09:00

तेज़, कम लागत वाला और scalable open source system framework End-to-End RLHF(Reinforcement Learning Human Feedback) के माध्यम से किसी भी scale पर high-quality ChatGPT style models बनाए जा सकते हैं 1-क्लिक में 48GB मेमोरी वाले एक NVIDIA A6000 GPU पर 1.3B parameter ChatGPT model को 1.36 घंटे के भीतर train, generate और serve किया जा सकता है Databricks Dolly, CarperAI-TRLX, Huggingface-PEFT आदि इसका उपयोग कर रहे हैं

(github.com/microsoft)

12 पॉइंट द्वारा xguru 2023-04-17 | 1 टिप्पणियां | WhatsApp पर शेयर करें

तेज़, कम लागत वाला और scalable open source system framework
End-to-End RLHF(Reinforcement Learning Human Feedback) के माध्यम से किसी भी scale पर high-quality ChatGPT style models बनाए जा सकते हैं
1-क्लिक में 48GB मेमोरी वाले एक NVIDIA A6000 GPU पर 1.3B parameter ChatGPT model को 1.36 घंटे के भीतर train, generate और serve किया जा सकता है
Databricks Dolly, CarperAI-TRLX, Huggingface-PEFT आदि इसका उपयोग कर रहे हैं

1 टिप्पणियां

xguru 2023-04-17

DeepSpeed - MS द्वारा जारी deep learning optimization library
Databricks ने ChatGPT जैसी Dolly 2.0 को open source के रूप में जारी किया

DeepSpeed Chat - RLHF का उपयोग करके ChatGPT-जैसे मॉडल को train करने के लिए framework

संबंधित पढ़ाई

1 टिप्पणियां