Copilot का परिचय और उपयोग अनुभव
(medium.com)-
Copilot, GPT-3 पर आधारित Codex को प्रोडक्टाइज़ करके बनाई गई एक सेवा है
-
GitHub पर मौजूद 5.4 करोड़ repo से निकाले गए 159GB dataset पर ट्रेनिंग की गई
-
164 benchmark dataset बनाए गए, और Codex ने उनमें से 28.8% को हल किया
-
LeetCode जैसी algorithm problems को अच्छी तरह हल करता है
-> संभवतः इसलिए कि GitHub पर algorithm problems के solutions वाले बहुत से repo हैं और उसने उन्हीं से सीखा है
GeekNews पर Copilot से संबंधित कुछ पोस्ट पहले भी आई थीं।
-
GitHub CoPilot - AI pair programmer https://hi.news.hada.io/topic?id=4526
-
GitHub Copilot : first impressions https://hi.news.hada.io/topic?id=4639
इस बार हमारे एक सहकर्मी Copilot पर लेख लिख रहे थे, और Copilot Preview अकाउंट सिर्फ मेरे पास था, इसलिए मैंने अपने कंप्यूटर पर थोड़ी मदद की।
टेस्ट करते समय जो बात चौंकाने वाली लगी, वह यह थी कि मैंने coding problems के 3 सवाल डाले और तुरंत pass होने वाले answers आ गए।
एक समस्या Baekjoon की थी, उसे translator से अनुवाद करके डाला था, फिर भी सही answer आया।
यह सोच भी आई कि online coding tests में cheating के लिए इसका उपयोग करने वाले लोग भी होंगे...
मैंने इसे VSCode में लगाकर एक महीने इस्तेमाल किया, और मेरा निष्कर्ष यह है:
-
जिस भाषा या environment की बस मोटी-मोटी समझ हो, उसमें development करते समय यह उपयोगी है।
-> React development करते समय
e.target.valueलेकर कुछ करना था। 20 अक्षरों का एक suggestion आया, मैंने Tab दबाकर autocomplete कर दिया, और वह बिल्कुल मनचाहे तरीके से काम कर गया।-> बेशक मुझे शक हुआ, इसलिए StackOverFlow पर जाकर चेक किया, और उसने जो suggest किया था वह सही निकला।
-
अगर भाषा या environment बहुत अच्छी तरह जानते हों, तो इसके suggestions optimal नहीं होते, इसलिए वे खटक सकते हैं।
-
Inference के लिए code भेजा जाएगा, यह चिंता रहती है कि क्या यह ठीक है? लेकिन फिर लगता है कि एक-एक फाइल में मौजूद code से कोई क्या कर लेगा, इसलिए मैं फिलहाल इसे बस इस्तेमाल कर रहा हूँ.
12 टिप्पणियां
https://www.youtube.com/watch?v=a9349pRiCRk
ऐसी राय भी है।
इसे देखकर मेरी रुचि अचानक काफी कम हो गई।
मुझे code copyright के बारे में अच्छी तरह पता नहीं है, लेकिन अगर copyright से सुरक्षित code में सिर्फ variable names या function names बदलकर, या थोड़ा-बहुत संशोधित करके इस्तेमाल किया जाए, तो क्या वह license violation माना जाएगा?
हाँ। यह उल्लंघन है।
कोड पूरी तरह एक जैसा है या नहीं, उससे ज़्यादा... कोड का स्रोत कहाँ से आया है? यही शायद कोड copyright में ज़्यादा महत्वपूर्ण तत्व है।
MIT या Apache license के मामले में उसे लाकर बदलने के बाद इस्तेमाल करने में बड़ी समस्या नहीं होगी, लेकिन...
अगर Copilot ने सुझाया गया कोड GPL license वाले कोड के समान कोड सुझाया हो..
और developer ने कोड का कुछ हिस्सा बदलकर उसे विकसित किए जा रहे project में शामिल कर दिया हो..
तो GPL license के हिसाब से क्या उस project का पूरा source code सार्वजनिक करना नहीं पड़ेगा, ऐसा मुझे लगता है।
मेरी समझ में, GPL license वाले कोड का उपयोग करने पर, अगर उसे इस्तेमाल करने वाले पूरे कोड को सार्वजनिक नहीं किया जाए तो वह GPL license का उल्लंघन माना जाता है।
अगर एक चरम उदाहरण को काल्पनिक रूप में लिखें तो...
किसी कंपनी में solution develop किया जा रहा है, और developer ने Copilot इस्तेमाल किया, लेकिन बदकिस्मती से सुझाया गया कोड किसी GPL license वाले स्थान के कोड को AI ने सीखकर लगभग वैसा ही उगल दिया हो...... तो क्या कंपनी के पूरे solution code को सार्वजनिक करना पड़े, ऐसा मुद्दा नहीं खड़ा हो सकता?
मुझे एक बात जाननी है: अगर यूज़र copilot द्वारा निकाले गए कोड को थोड़ा-सा बदलकर इस्तेमाल करे, तो क्या उसे पकड़ने का कोई तरीका है? एक ही I/O और एक ही फ़ंक्शनैलिटी के लिए अलग-अलग स्टाइल का कोड आ सकता है, तो ऐसे कोड plagiarism को कैसे पकड़ा जाता है, यह जानने की जिज्ञासा है (क्या संगीत plagiarism मुकदमों की तरह कोई methodology होती है, जिसमें references से आपस में तुलना की जाती है?)
खैर, समानता को कैसे वेरिफ़ाई किया जाए और किस हद तक उसे वही code माना जाए, इसका मानदंड क्या होना चाहिए, यह मुझे भी ठीक से नहीं पता, हाहा
इससे संबंधित पोस्ट GeekNews पर भी आई थी
https://hi.news.hada.io/topic?id=4659
उस YouTube वीडियो में कॉपीराइट की बात की गई है, लेकिन वीडियो में इस्तेमाल किए गए स्रोत दृश्य (news, cartoon animation आदि) के लिए स्रोत या कॉपीराइट का उल्लेख ही नहीं है, यह देखकर लगता है कि यह वाकई बहुत मुश्किल मामला है T_T
जिस वीडियो की आपने ओर इशारा किया, उसमें मौजूद समाचार/कॉमिक्स के copyright की जिम्मेदारी ... उसे इस्तेमाल करने वाले पक्ष (वीडियो बनाने/वितरित करने वाले व्यक्ति) पर ही आएगी, लेकिन..
मुद्दा यह है कि अगर Copilot इस्तेमाल करते समय copyright से जुड़ा हुआ code मेरे code में शामिल हो जाए तो क्या होगा।
मैंने तो सिर्फ एक tool इस्तेमाल किया, लेकिन उस वजह से मेरे द्वारा विकसित किया गया program copyright मुकदमे में फंस सकता है।
मैं भी इसे इस्तेमाल करके देखना चाहता हूँ, लेकिन पता नहीं मुझे यह कब तक असाइन होगा, उफ
+1 मैं अभी भी इंतज़ार कर रहा हूँ
मेरी जानकारी के अनुसार, आप Github जितना ज़्यादा इस्तेमाल करते हैं, यह उतनी ही जल्दी मिलता है.
किसी तरह पिछले साल कोरोना की वजह से जल्दी-जल्दी बनाया गया मेरा एक Repo 100 से ज़्यादा Star पा गया। शायद उसी की वजह से, Copilot हो या GitHub Codespace, मैं आवेदन करता हूँ तो अक्सर चुन लिया जाता हूँ।