• Yandex ने इसे जारी किया है, इसलिए डेवलपर/शोधकर्ता कोई भी इसे मुफ्त में उपयोग कर सकता है
  • अंग्रेज़ी और रूसी की 1.7TB टेक्स्ट पर 800 A100 GPU का उपयोग करके 65 दिनों तक ट्रेन किया गया
  • Microsoft के Megatron-LM कोड पर आधारित

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.