YaLM 100B - 100 अरब पैरामीटर वाला GPT-like भाषा मॉडल
(github.com/yandex)- Yandex ने इसे जारी किया है, इसलिए डेवलपर/शोधकर्ता कोई भी इसे मुफ्त में उपयोग कर सकता है
- अंग्रेज़ी और रूसी की 1.7TB टेक्स्ट पर 800 A100 GPU का उपयोग करके 65 दिनों तक ट्रेन किया गया
- Microsoft के Megatron-LM कोड पर आधारित
अभी कोई टिप्पणी नहीं है.