ColossalChat - ChatGPT को क्लोन करने के लिए RLHF पाइपलाइन का ओपन सोर्स समाधान
(medium.com/@yangyou_berkeley)- LLaMA मॉडल पर आधारित
- Supervised डेटा संग्रह
- Supervised fine-tuning
- Reward मॉडल ट्रेनिंग
- Reinforcement Learning fine-tuning
- शामिल सामग्री
- ऑनलाइन चलने वाला interactive demo
- 7B/13B मॉडल सहित पूरा RLHF training code open source
- Chinese/English से बना 104k bilingual dataset
- 7B मॉडल का 4-bit quantization. केवल 4GB GPU memory की आवश्यकता
- मॉडल weights शामिल. single server पर आसानी से पुनरुत्पादित किया जा सकता है
- बड़े मॉडल/dataset/optimization आदि भी लगातार जोड़े जाने की योजना
अभी कोई टिप्पणी नहीं है.