ColossalChat - ChatGPT को क्लोन करने के लिए RLHF पाइपलाइन का ओपन सोर्स समाधान

xguru · 2023-03-31T11:32:02+09:00

LLaMA मॉडल पर आधारित Supervised डेटा संग्रह Supervised fine-tuning Reward मॉडल ट्रेनिंग Reinforcement Learning fine-tuning शामिल सामग्री ऑनलाइन चलने वाला interactive demo 7B/13B मॉडल सहित पूरा RLHF training code open source Chinese/English से बना 104k bilingual dataset 7B मॉडल का 4-bit quantization. केवल 4GB GPU memory की आवश्यकता मॉडल weights शामिल. single server पर आसानी से पुनरुत्पादित किया जा सकता है बड़े मॉडल/dataset/optimization आदि भी लगातार जोड़े जाने की योजना

(medium.com/@yangyou_berkeley)

10 पॉइंट द्वारा xguru 2023-03-31 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

LLaMA मॉडल पर आधारित
- Supervised डेटा संग्रह
- Supervised fine-tuning
- Reward मॉडल ट्रेनिंग
- Reinforcement Learning fine-tuning
शामिल सामग्री
- ऑनलाइन चलने वाला interactive demo
- 7B/13B मॉडल सहित पूरा RLHF training code open source
- Chinese/English से बना 104k bilingual dataset
- 7B मॉडल का 4-bit quantization. केवल 4GB GPU memory की आवश्यकता
- मॉडल weights शामिल. single server पर आसानी से पुनरुत्पादित किया जा सकता है
- बड़े मॉडल/dataset/optimization आदि भी लगातार जोड़े जाने की योजना

ColossalChat - ChatGPT को क्लोन करने के लिए RLHF पाइपलाइन का ओपन सोर्स समाधान

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.