24 अप्रैल तक मना नहीं किया तो GitHub निजी repositories के डेटा से AI training करेगा
(news.ycombinator.com)- GitHub निजी repositories के code और data को AI model training में इस्तेमाल करने की योजना बना रहा है
- उपयोगकर्ताओं को 24 अप्रैल से पहले स्पष्ट रूप से opt-out करना होगा, तभी उनका data इस्तेमाल होने से रोका जा सकेगा
- opt-out नहीं करने पर private project information training data में शामिल हो सकती है
- यह नीति GitHub Copilot जैसे AI features को बेहतर बनाने के लिए data collection से जुड़ी है
- developers को privacy और code security के लिए अपनी settings जांचनी चाहिए
GitHub की AI training data policy में बदलाव
- GitHub ने policy बदल दी है ताकि AI models को बेहतर बनाने के उद्देश्य से निजी repositories का data training में शामिल किया जा सके
- अगर उपयोगकर्ता अलग से मना नहीं करते, तो data अपने-आप इस्तेमाल होगा
- opt-out GitHub settings page से सीधे किया जा सकता है
- training data में private code, project metadata, commit history आदि शामिल होने की संभावना है
- GitHub के अनुसार यह कदम Copilot और अन्य AI features की quality सुधारने के लिए है
developers पर असर
- अगर निजी repositories training में इस्तेमाल होती हैं, तो sensitive code या internal logic के उजागर होने का जोखिम मौजूद है
- कंपनियों और individual developers को security policies की समीक्षा और opt-out प्रक्रिया पूरी करनी चाहिए
- GitHub का यह बदलाव AI training data की transparency और user control पर नई चर्चा को जन्म दे सकता है
3 टिप्पणियां
कुछ दिनों से यह GitHub पर लगातार दिख रहा था,
Important update
On April 24 we'll start using GitHub Copilot interaction data for AI model training unless you opt out. Review this update and manage your preferences in your GitHub account settings.
मैंने opt out कर दिया, लेकिन लगता है कि वे पहले से ही इसे AI के लिए इस्तेमाल कर रहे थे, है ना।
यह तो बहुत ही बेशर्म फेक न्यूज़ है।
Hacker News की रायें
2023 से लगातार यही कहा जा रहा है। अगर database में stored जानकारी ऐसी form में है जिस तक कंपनी खुलकर पहुँच सकती है, तो आखिरकार वह कंपनी terms बदलकर उसे AI training data के रूप में इस्तेमाल करेगी। incentive इतना मजबूत है कि इससे बचना मुश्किल है
“ऐसा नहीं है” कहते हुए GitHub official blog का लिंक साझा किया गया। Free, Pro, Pro+ Copilot users अगर opt-out नहीं करते, तो उनका usage data model training में इस्तेमाल होगा। Business या Pro subscribers training में शामिल नहीं होंगे। अगर Copilot इस्तेमाल नहीं करते, तो कोई असर नहीं है। अभी पहले से opt-out कर देने पर बाद में भी setting बनी रहेगी
इस खबर का शीर्षक भ्रामक है। GitHub private repo को सीधे training नहीं दे रहा, बल्कि Copilot इस्तेमाल के दौरान बनने वाले interaction data पर training कर रहा है। अगर Copilot इस्तेमाल नहीं करते, तो असर नहीं है। फिर भी इसे बंद कर देना बेहतर है
तकनीकी रूप से देखें तो opt-out, Copilot training setting है। अब तक सिर्फ public repo opt-in थे, लेकिन 24 अप्रैल से private repo भी default रूप से शामिल होंगे। अगर आप private repo में Copilot इस्तेमाल कर रहे हैं, तो github.com/settings/copilot पर जाकर opt-out कर देना अच्छा रहेगा। इसमें 30 seconds लगते हैं
सोच रहा हूँ कि अगर team में एक भी व्यक्ति opt-out न करे, तो क्या Copilot को पूरे repo तक access मिल सकता है। यह भी जानना है कि team members की setting status जाँचने का कोई तरीका है या नहीं
अभी setting सिर्फ user level पर ही संभव लगती है। क्या organization-wide इसे एक साथ disable करने का कोई तरीका है, यह जानना चाहता हूँ। चिंता है कि अगर एक व्यक्ति भी इसे on रखे, तो organization का code training data माना जाएगा
यह मानना पड़ेगा कि GitHub ने banner notice लगातार दिखाया है। लेकिन मैंने भी यह HN पोस्ट देखने से पहले उसे नहीं पढ़ा था
मेरे private repo में बहुत खराब code है, इसलिए चिंता की ज़रूरत नहीं। उल्टा LLM अगर मेरे code पर train हुआ, तो उसका ही नुकसान होगा
GitHub को लंबे समय से paid रूप में इस्तेमाल कर रहे जिन लोगों ने यह notice नहीं देखा, उनके लिए बुरा लगता है