Google ने 1.6 ट्रिलियन पैरामीटर वाला AI NLP मॉडल Switch Transformer को open source किया

xguru · 2021-02-19T10:43:21+09:00

मौजूदा T5(Text-to-Text Transfer Transformer) मॉडल की तुलना में training speed में 7x सुधार Switch Routing नाम के एक परिवर्तित MoE(Mixture-of-Experts) algorithm का उपयोग, जो input values के अनुसार अलग-अलग parameters लागू करता है मॉडल training के लिए Mesh-Tensorflow का उपयोग (Model Parallelism)

(infoq.com)

3 पॉइंट द्वारा xguru 2021-02-19 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

मौजूदा T5(Text-to-Text Transfer Transformer) मॉडल की तुलना में training speed में 7x सुधार
Switch Routing नाम के एक परिवर्तित MoE(Mixture-of-Experts) algorithm का उपयोग, जो input values के अनुसार अलग-अलग parameters लागू करता है
मॉडल training के लिए Mesh-Tensorflow का उपयोग (Model Parallelism)

Google ने 1.6 ट्रिलियन पैरामीटर वाला AI NLP मॉडल Switch Transformer को open source किया

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.