13 पॉइंट द्वारा laeyoung 2021-08-02 | 12 टिप्पणियां | WhatsApp पर शेयर करें
  • Copilot, GPT-3 पर आधारित Codex को प्रोडक्टाइज़ करके बनाई गई एक सेवा है

  • GitHub पर मौजूद 5.4 करोड़ repo से निकाले गए 159GB dataset पर ट्रेनिंग की गई

  • 164 benchmark dataset बनाए गए, और Codex ने उनमें से 28.8% को हल किया

  • LeetCode जैसी algorithm problems को अच्छी तरह हल करता है

    -> संभवतः इसलिए कि GitHub पर algorithm problems के solutions वाले बहुत से repo हैं और उसने उन्हीं से सीखा है


GeekNews पर Copilot से संबंधित कुछ पोस्ट पहले भी आई थीं।

इस बार हमारे एक सहकर्मी Copilot पर लेख लिख रहे थे, और Copilot Preview अकाउंट सिर्फ मेरे पास था, इसलिए मैंने अपने कंप्यूटर पर थोड़ी मदद की।

टेस्ट करते समय जो बात चौंकाने वाली लगी, वह यह थी कि मैंने coding problems के 3 सवाल डाले और तुरंत pass होने वाले answers आ गए।

एक समस्या Baekjoon की थी, उसे translator से अनुवाद करके डाला था, फिर भी सही answer आया।

यह सोच भी आई कि online coding tests में cheating के लिए इसका उपयोग करने वाले लोग भी होंगे...

मैंने इसे VSCode में लगाकर एक महीने इस्तेमाल किया, और मेरा निष्कर्ष यह है:

  • जिस भाषा या environment की बस मोटी-मोटी समझ हो, उसमें development करते समय यह उपयोगी है।

    -> React development करते समय e.target.value लेकर कुछ करना था। 20 अक्षरों का एक suggestion आया, मैंने Tab दबाकर autocomplete कर दिया, और वह बिल्कुल मनचाहे तरीके से काम कर गया।

    -> बेशक मुझे शक हुआ, इसलिए StackOverFlow पर जाकर चेक किया, और उसने जो suggest किया था वह सही निकला।

  • अगर भाषा या environment बहुत अच्छी तरह जानते हों, तो इसके suggestions optimal नहीं होते, इसलिए वे खटक सकते हैं।

  • Inference के लिए code भेजा जाएगा, यह चिंता रहती है कि क्या यह ठीक है? लेकिन फिर लगता है कि एक-एक फाइल में मौजूद code से कोई क्या कर लेगा, इसलिए मैं फिलहाल इसे बस इस्तेमाल कर रहा हूँ.

12 टिप्पणियां

 
ruinnel 2021-08-03

https://www.youtube.com/watch?v=a9349pRiCRk

ऐसी राय भी है।

इसे देखकर मेरी रुचि अचानक काफी कम हो गई।

 
budlebee 2021-08-03

मुझे code copyright के बारे में अच्छी तरह पता नहीं है, लेकिन अगर copyright से सुरक्षित code में सिर्फ variable names या function names बदलकर, या थोड़ा-बहुत संशोधित करके इस्तेमाल किया जाए, तो क्या वह license violation माना जाएगा?

 
dalinaum 2021-08-05

हाँ। यह उल्लंघन है।

 
ruinnel 2021-08-03

कोड पूरी तरह एक जैसा है या नहीं, उससे ज़्यादा... कोड का स्रोत कहाँ से आया है? यही शायद कोड copyright में ज़्यादा महत्वपूर्ण तत्व है।

MIT या Apache license के मामले में उसे लाकर बदलने के बाद इस्तेमाल करने में बड़ी समस्या नहीं होगी, लेकिन...

अगर Copilot ने सुझाया गया कोड GPL license वाले कोड के समान कोड सुझाया हो..

और developer ने कोड का कुछ हिस्सा बदलकर उसे विकसित किए जा रहे project में शामिल कर दिया हो..

तो GPL license के हिसाब से क्या उस project का पूरा source code सार्वजनिक करना नहीं पड़ेगा, ऐसा मुझे लगता है।

मेरी समझ में, GPL license वाले कोड का उपयोग करने पर, अगर उसे इस्तेमाल करने वाले पूरे कोड को सार्वजनिक नहीं किया जाए तो वह GPL license का उल्लंघन माना जाता है।

अगर एक चरम उदाहरण को काल्पनिक रूप में लिखें तो...

किसी कंपनी में solution develop किया जा रहा है, और developer ने Copilot इस्तेमाल किया, लेकिन बदकिस्मती से सुझाया गया कोड किसी GPL license वाले स्थान के कोड को AI ने सीखकर लगभग वैसा ही उगल दिया हो...... तो क्या कंपनी के पूरे solution code को सार्वजनिक करना पड़े, ऐसा मुद्दा नहीं खड़ा हो सकता?

 
budlebee 2021-08-03

मुझे एक बात जाननी है: अगर यूज़र copilot द्वारा निकाले गए कोड को थोड़ा-सा बदलकर इस्तेमाल करे, तो क्या उसे पकड़ने का कोई तरीका है? एक ही I/O और एक ही फ़ंक्शनैलिटी के लिए अलग-अलग स्टाइल का कोड आ सकता है, तो ऐसे कोड plagiarism को कैसे पकड़ा जाता है, यह जानने की जिज्ञासा है (क्या संगीत plagiarism मुकदमों की तरह कोई methodology होती है, जिसमें references से आपस में तुलना की जाती है?)

 
ruinnel 2021-08-03

खैर, समानता को कैसे वेरिफ़ाई किया जाए और किस हद तक उसे वही code माना जाए, इसका मानदंड क्या होना चाहिए, यह मुझे भी ठीक से नहीं पता, हाहा

 
laeyoung 2021-08-03

इससे संबंधित पोस्ट GeekNews पर भी आई थी

https://hi.news.hada.io/topic?id=4659

उस YouTube वीडियो में कॉपीराइट की बात की गई है, लेकिन वीडियो में इस्तेमाल किए गए स्रोत दृश्य (news, cartoon animation आदि) के लिए स्रोत या कॉपीराइट का उल्लेख ही नहीं है, यह देखकर लगता है कि यह वाकई बहुत मुश्किल मामला है T_T

 
ruinnel 2021-08-03

जिस वीडियो की आपने ओर इशारा किया, उसमें मौजूद समाचार/कॉमिक्स के copyright की जिम्मेदारी ... उसे इस्तेमाल करने वाले पक्ष (वीडियो बनाने/वितरित करने वाले व्यक्ति) पर ही आएगी, लेकिन..

मुद्दा यह है कि अगर Copilot इस्तेमाल करते समय copyright से जुड़ा हुआ code मेरे code में शामिल हो जाए तो क्या होगा।

मैंने तो सिर्फ एक tool इस्तेमाल किया, लेकिन उस वजह से मेरे द्वारा विकसित किया गया program copyright मुकदमे में फंस सकता है।

 
yeop2 2021-08-02

मैं भी इसे इस्तेमाल करके देखना चाहता हूँ, लेकिन पता नहीं मुझे यह कब तक असाइन होगा, उफ

 
ktseo41 2021-08-02

+1 मैं अभी भी इंतज़ार कर रहा हूँ

 
cog25 2021-08-02

मेरी जानकारी के अनुसार, आप Github जितना ज़्यादा इस्तेमाल करते हैं, यह उतनी ही जल्दी मिलता है.

 
laeyoung 2021-08-02

किसी तरह पिछले साल कोरोना की वजह से जल्दी-जल्दी बनाया गया मेरा एक Repo 100 से ज़्यादा Star पा गया। शायद उसी की वजह से, Copilot हो या GitHub Codespace, मैं आवेदन करता हूँ तो अक्सर चुन लिया जाता हूँ।