BigCode - ओपन सोर्स के साथ कोड जनरेशन के लिए AI बनाने की परियोजना
(bigcode-project.org)- GitHub के Copilot में उपयोग होने वाले OpenAI के Codex जैसी क्षमताएँ देने वाला source code के लिए LLM(Large Language Model) बनाने का ओपन प्रोजेक्ट
- इसे Hugging Face और ServiceNow R&D के सहयोग से बनाया जाएगा
- कोड जनरेशन सिस्टम को train करने के लिए बड़े पैमाने का dataset उपलब्ध कराना इसका लक्ष्य है
- Codex से भी बड़ा, 15 अरब parameters का सेट
4 टिप्पणियां
आखिरकार, CoPilot की लागत आती है और इस वजह से उस पर इधर-उधर कई पाबंदियां हैं,
इसलिए अच्छा होगा अगर यह Stable Diffusion की तरह कोई बड़ा बदलाव लेकर आए।
मुझे लगता है कि अगर यह Stable Diffusion की तरह लोकल पर भी चल सके तो अच्छा होगा। आखिरकार Copliot में (चाहे वह code privacy का कितना भी अच्छा ध्यान रखे और encryption भी करे) बाहरी communication की ज़रूरत पड़ती है। और उस communication में source code शामिल होने की वजह से यह थोड़ा असहज लगता है।
वो सही है।
व्यावहारिक रूप से देखें तो यह LLM(Large Language Model) है, इसलिए इसे सीधे लोकल पर चलाना शायद मुश्किल होगा, लेकिन अगर यह on-prem में डाला जा सकने वाले आकार तक हो तो काफ़ी उपयोगी लग सकता है। 15 अरब पैरामीटर हों तो, इसके पैरामीटर साइज GPT-2(1.5 अरब) और GPT-3(175 अरब) के बीच पड़ते हैं—क्या यह चल पाएगा... आह
मुझे लगता है GPT-2 को लोकल पर चलाया जा सकता था। Tabnine उसी मॉडल पर आधारित है, और वह लोकल मॉडल भी उपलब्ध कराता है।