BigCode - ओपन सोर्स के साथ कोड जनरेशन के लिए AI बनाने की परियोजना

xguru · 2022-09-29T11:12:02+09:00

GitHub के Copilot में उपयोग होने वाले OpenAI के Codex जैसी क्षमताएँ देने वाला source code के लिए LLM(Large Language Model) बनाने का ओपन प्रोजेक्ट इसे Hugging Face और ServiceNow R&D के सहयोग से बनाया जाएगा कोड जनरेशन सिस्टम को train करने के लिए बड़े पैमाने का dataset उपलब्ध कराना इसका लक्ष्य है Codex से भी बड़ा, 15 अरब parameters का सेट

(bigcode-project.org)

10 पॉइंट द्वारा xguru 2022-09-29 | 4 टिप्पणियां | WhatsApp पर शेयर करें

GitHub के Copilot में उपयोग होने वाले OpenAI के Codex जैसी क्षमताएँ देने वाला source code के लिए LLM(Large Language Model) बनाने का ओपन प्रोजेक्ट
इसे Hugging Face और ServiceNow R&D के सहयोग से बनाया जाएगा
कोड जनरेशन सिस्टम को train करने के लिए बड़े पैमाने का dataset उपलब्ध कराना इसका लक्ष्य है
Codex से भी बड़ा, 15 अरब parameters का सेट

4 टिप्पणियां

xguru 2022-09-29

आखिरकार, CoPilot की लागत आती है और इस वजह से उस पर इधर-उधर कई पाबंदियां हैं,
इसलिए अच्छा होगा अगर यह Stable Diffusion की तरह कोई बड़ा बदलाव लेकर आए।

ffdd270 2022-09-29

मुझे लगता है कि अगर यह Stable Diffusion की तरह लोकल पर भी चल सके तो अच्छा होगा। आखिरकार Copliot में (चाहे वह code privacy का कितना भी अच्छा ध्यान रखे और encryption भी करे) बाहरी communication की ज़रूरत पड़ती है। और उस communication में source code शामिल होने की वजह से यह थोड़ा असहज लगता है।

laeyoung 2022-09-29

वो सही है।

व्यावहारिक रूप से देखें तो यह LLM(Large Language Model) है, इसलिए इसे सीधे लोकल पर चलाना शायद मुश्किल होगा, लेकिन अगर यह on-prem में डाला जा सकने वाले आकार तक हो तो काफ़ी उपयोगी लग सकता है। 15 अरब पैरामीटर हों तो, इसके पैरामीटर साइज GPT-2(1.5 अरब) और GPT-3(175 अरब) के बीच पड़ते हैं—क्या यह चल पाएगा... आह

ffdd270 2022-09-29

मुझे लगता है GPT-2 को लोकल पर चलाया जा सकता था। Tabnine उसी मॉडल पर आधारित है, और वह लोकल मॉडल भी उपलब्ध कराता है।

BigCode - ओपन सोर्स के साथ कोड जनरेशन के लिए AI बनाने की परियोजना

संबंधित पढ़ाई

4 टिप्पणियां