19 पॉइंट द्वारा kuroneko 2023-05-04 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • Replit ने एक नया code generation LLM व्यावसायिक उपयोग के लिए उपलब्ध ओपन सोर्स के रूप में जारी किया।
  • 2.7B parameters के साथ यह हल्का और तेज़ है, और इसका प्रशिक्षण सिर्फ 10 दिनों में पूरा हुआ।
  • समान श्रेणी के मॉडलों की तुलना में 40% बेहतर प्रदर्शन, और fine-tuned मॉडल का प्रदर्शन Codex से भी बेहतर है।
  • इसे The Stack dataset पर प्रशिक्षित किया गया है, और यह 20 से अधिक भाषाओं में जनरेट कर सकता है।
  • Hugging Face पर सीधे demo इस्तेमाल किया जा सकता है.

2 टिप्पणियां

 
kuroneko 2023-05-04

इन दिनों ऐसा लग रहा है कि commercial use के लिए उपलब्ध open source LLM काफ़ी बढ़ गए हैं। शायद LLaMA से प्रेरित होकर...

और model size के मुकाबले performance काफ़ी बेहतर हुई है, यह बात मुझे अच्छी लगी।
मुझे लगता है कि यह स्तर ऐसा है जिसे सामान्य development कंप्यूटर पर, बिना GPU के, local में चलाया जा सकता है।