GPT-Neo : GPT-3 स्तर के मॉडल को open source/मुफ़्त बनाने की परियोजना

xguru · 2021-01-19T09:54:11+09:00

GPT-3+ आकार तक scale किए जा सकने वाले दो implementation विकसित किए जा रहे हैं → GPT-Neo : Tensorflow-mesh(TPU) आधारित code → GPT-Neox : DeepSpeed(GPU) आधारित code फिलहाल GPT-2 स्तर का training पूरा हो चुका है और मॉडल evaluation की समीक्षा की जा रही है single-stage training के साथ 200 billion parameters तक test

(github.com)

7 पॉइंट द्वारा xguru 2021-01-19 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

GPT-3+ आकार तक scale किए जा सकने वाले दो implementation विकसित किए जा रहे हैं

→ GPT-Neo : Tensorflow-mesh(TPU) आधारित code

→ GPT-Neox : DeepSpeed(GPU) आधारित code

फिलहाल GPT-2 स्तर का training पूरा हो चुका है और मॉडल evaluation की समीक्षा की जा रही है
single-stage training के साथ 200 billion parameters तक test

GPT-Neo : GPT-3 स्तर के मॉडल को open source/मुफ़्त बनाने की परियोजना

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.