• LLaMA मॉडल पर आधारित
    • Supervised डेटा संग्रह
    • Supervised fine-tuning
    • Reward मॉडल ट्रेनिंग
    • Reinforcement Learning fine-tuning
  • शामिल सामग्री
    • ऑनलाइन चलने वाला interactive demo
    • 7B/13B मॉडल सहित पूरा RLHF training code open source
    • Chinese/English से बना 104k bilingual dataset
    • 7B मॉडल का 4-bit quantization. केवल 4GB GPU memory की आवश्यकता
    • मॉडल weights शामिल. single server पर आसानी से पुनरुत्पादित किया जा सकता है
    • बड़े मॉडल/dataset/optimization आदि भी लगातार जोड़े जाने की योजना

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.