9 पॉइंट द्वारा xguru 2022-12-10 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • GitHub पर commit के ज़रिए चुपचाप जारी किया गया
  • normalization के साथ और अधिक Epochs* तक train किया गया, और पिछले मॉडल की तुलना में बेहतर performance दिखाता है
  • architecture पहले जैसा ही है
  • load_model("large") कॉल करने पर, "large-v2" मॉडल load होता है
  • इस मॉडल से संबंधित paper जल्द जारी होने की उम्मीद है
  • Epoch : training dataset में शामिल सभी data का एक-एक बार मॉडल से गुजरना (Forward Pass/Backward Pass)। यानी पूरे dataset को एक बार सीखने की इकाई