- Microsoft के आधिकारिक Learn पोर्टल पर प्रकाशित एक डायग्राम के बारे में यह आरोप सामने आया कि वह पहले से मशहूर Git branching model diagram से बहुत मिलता-जुलता है
- मूल रचनाकार ने 2010 में यह डायग्राम खुद बनाया और सार्वजनिक किया था, और उसके बाद यह किताबों, talks, blogs, team wiki, YouTube आदि में व्यापक रूप से इस्तेमाल होता रहा
- ऐसा लगता है कि Microsoft ने इसे AI image generator से बदलकर बिना attribution के प्रकाशित किया, और नतीजे में “continvoucly morged” जैसी टाइपो और गलत arrows जैसी खराब quality साफ दिखाई देती है
- लेखक का कहना है कि मुद्दा सिर्फ इस्तेमाल का नहीं, बल्कि process और carefulness की कमी का है—यानी किसी और के बारीक काम को मशीन से पतला करके अपने काम की तरह बाँटना
- उनका कहना है कि source attribution और original link देना ही पर्याप्त होता, और आगे इस तरह के AI-आधारित plagiarism content के फैलाव को लेकर उन्होंने चिंता जताई
Microsoft Learn पोर्टल की घटना
- हाल ही में Microsoft Learn पोर्टल पर प्रकाशित एक डायग्राम के बारे में Bluesky और Hacker News के जरिए यह बात सामने आई कि वह 2010 में बने Git branching model diagram से बहुत मिलता-जुलता है
- मूल रचनाकार ने उस समय Apple Keynote में इसे खुद डिज़ाइन किया था और colors, curves, placement आदि को बारीकी से adjust करके branch relations को साफ तौर पर दिखाया था
- उन्होंने source file भी सार्वजनिक कर दी थी ताकि कोई भी उसका उपयोग कर सके, और बाद में यह पूरे इंटरनेट पर व्यापक रूप से फैल गया
- ऐसा लगता है कि 15 साल बाद Microsoft ने उसी डायग्राम को AI image generator से बदलकर प्रकाशित किया, और वह भी बिना attribution या link के
AI-generated सामग्री की quality समस्या
- बदले गए डायग्राम में मूल का visual language और layout खो गया है, और colors, line paths, dot alignment आदि बिखरे हुए रूप में दिखते हैं
- कुछ arrows गायब हैं या गलत दिशा में हैं, और इसमें “continvoucly morged” जैसा वाक्यांश भी शामिल है, जिससे AI-generated output के संकेत साफ दिखते हैं
- लेखक ने इसे “AI slop” कहा और इसे Microsoft के स्तर के अनुरूप न होने वाला लापरवाह output बताया
कम्युनिटी की प्रतिक्रिया और meme का फैलाव
- डायग्राम का रूप मूल से इतना मिलता-जुलता था कि लोगों ने उसे तुरंत पहचान लिया, Microsoft पर plagiarism का शक जताया और मूल रचनाकार से संपर्क किया
- “continvoucly morged” वाक्यांश internet meme के रूप में फैल गया, और कई उपयोगकर्ताओं ने मूल रचनाकार का समर्थन किया
असली समस्या और चिंता
- लेखक का कहना है कि समस्या सिर्फ reuse नहीं है, बल्कि किसी और के सावधानी से किए गए काम को मशीन से धोकर उसके घटिया रूप को वितरित करना है
- उनके अनुसार यह “प्रेरित होकर बेहतर बनाना” नहीं, बल्कि “जो अच्छी तरह काम कर रहा था उसे बिगाड़ देना” है
- उनका कहना है कि इस मामले में यह मशहूर डायग्राम होने की वजह से plagiarism के रूप में आसानी से पहचाना गया, लेकिन आगे कम प्रसिद्ध content को AI से बदलकर पहचानना मुश्किल हो सकता है
अनुरोध और समापन
- लेखक ने कहा कि मूल लिंक और source attribution देना ही पर्याप्त है
- उन्होंने यह भी पूछा कि Microsoft Learn पेज आखिर कैसे बनाया गया, और क्या creation process और review procedure जैसा कुछ था
- लेख का अंत “Till next 'tim'.” वाक्यांश से होता है
1 टिप्पणियां
Hacker News की राय
मूल git-flow मॉडल को लेकर समझ नहीं आता कि आखिर क्यों एक अलग
developब्रांच में integration किया जाए औरmain/masterको सिर्फ release tag लगाने के लिए रखा जाएइसकी जगह
mainब्रांच को ही integration के लिए इस्तेमाल करें तो ज़्यादा साफ-सुथरा लगेगा। Tag से latest release अलग दिख ही सकती है, फिरdevelopकी ज़रूरत क्यों होfeature,release,hotfixब्रांच की अवधारणा शानदार है, लेकिनdevelopअजीब-सा पुराना अवशेष लगता हैमेरा मानना है कि git-flow सिर्फ इसलिए लोकप्रिय हुआ क्योंकि उसका नाम और diagram अच्छे लगते थे। इसकी आलोचना करो तो जवाब मिलता है, “यह standard है, इसे क्यों बदलें”
बेहतर approach के लिए trunkbaseddevelopment.com देखा जा सकता है
main/masterके साथ काम करता आया हूँ, लेकिनdevelopन होने पर कुछ समस्याएँ भी आती हैंअगर
masterमें merge कर दें, तो QA पूरा होने तक अगला release रुक जाता है। दूसरी तरफdevelopमें independent changes को cherry-pick करके मनचाहे क्रम में release किया जा सकता हैअगर team product-based है, तो release हुए commits को साफ़ तौर पर दिखाने वाली कोई branch चाहिए। Tag भी काफ़ी हो सकती है, लेकिन branch से manage करने पर यह भी track किया जा सकता है कि hotfix कब apply हुआ
आज के SaaS माहौल में यह कम दिखता है, लेकिन security patches या backporting में अब भी उपयोगी है
ज़्यादातर मामलों में trunk-based development और feature branches ही काफ़ी हैं
आजकल AI-generated content की स्थिति बहुत ख़राब हो गई है
Los Alamos वाला वीडियो भी नकली images से भरा था, और GG-1 locomotive documentary भी AI images की वजह से बिगड़ गई थी
YouTube thumbnails तक AI से बेहूदा बन रहे हैं, और ग़लत सलाह देने वाले videos की भरमार है
अगर यही सामग्री फिर LLM training data में लौटेगी, तो एक दुष्चक्र बन जाएगा
आख़िर में असली नुकसान किसी और को झेलना पड़ता है
आवाज़ भी synthetic थी और text भी, और ऊपर से बस यह बहाना जोड़ दिया गया था कि “यह उनकी physics lectures पर आधारित है”
मुझे विदेश से एक AI से छेड़छाड़ किया गया product मिला था
मैंने बच्चे के कमरे के लिए planets rug ऑर्डर किया, लेकिन जो आया उसमें टूटी-फूटी AI image छपी थी और text बिगड़ा हुआ था (जैसे: MARS → MɅPS)
अच्छी बात यह रही कि refund मिल गया और मैंने दूसरे seller से सही वाला खरीद लिया
लगता है आजकल कुछ व्यापारी AI से दूसरों के design को बस ऊपर-ऊपर से कॉपी कर रहे हैं
फोटो में भी typo को किसी object से छिपाया गया था। मज़ेदार भी था और अजीब भी
थोड़ा महँगा हो तो भी सामने देखकर खरीदना ज़्यादा सुकून देता है
मूल diagram हट चुका है, लेकिन वह archive.is/twft6 पर सुरक्षित है
संबंधित लिंक
“continvoucly morged” यह phrase स्थिति का इतना सटीक सार बताती है कि कमाल है। लगभग काव्यात्मक
सच कहूँ तो यह पूरी घटना मज़ेदार भी लगती है और डरावनी भी
AI का ख़तरा उसकी self-awareness में नहीं, बल्कि ग़ैर-जिम्मेदार users के आत्मविश्वास में है
Microsoft के एक vice president ने Bluesky पर सफ़ाई दी
संबंधित पोस्ट लिंक
उन्होंने कहा, “यह vendor द्वारा बनाई गई सामग्री थी, हम कारण की जाँच कर रहे हैं और इसे जल्द हटाएँगे,” लेकिन ऐसी सफ़ाई खोखली लगती है
इतने बड़े संगठन में ऐसी गलती public तक पहुँच जाना systemic failure है
ऐसे नियंत्रणहीन हालात में कभी न कभी इससे भी बड़ी गड़बड़ी होगी
Microsoft की हाल की चूकों के जमा होने से उसके market value पर भी सवाल उठते हैं
समस्या यह है कि review process लगभग है ही नहीं
समझ नहीं आता Microsoft हमेशा आधा-पका output ही क्यों निकालता है
AI से बना graph हो तो भी उसे Paint में ठीक किया जा सकता था
exFAT की तरह, ऊपर से सब ठीक चलता दिखता है लेकिन अंदर झाँको तो सब बिखरा हुआ मिलता है
इसके बावजूद मजबूरी में उसे इस्तेमाल करना पड़ता है
LinkedIn भी आजकल AI-generated slides से भरा पड़ा है
ChatGPT से “इसे बेहतर बना दो” कहकर निकाले गए outputs में grammar भी ख़राब होती है और graphs भी बेमतलब होते हैं
ख़ासकर energy industry में datacenter boom की वजह से ऐसा content बहुत बढ़ गया है
उदाहरण1, उदाहरण2, उदाहरण3
(वैसे, मेरे फ़ोन की battery 14% पर भी कई दिन चल जाती है)
सब लोग अपना असली रूप छिपाते हैं, भावुक दिखने की कोशिश करते हैं, और अंत में बात sales पर आकर ख़त्म होती है
wiktionary का morg entry देखें तो यह English word नहीं है, लेकिन Irish में मौजूद है
AI जो इस तरह का अनपेक्षित chaos पैदा करता है, उसमें भी एक अजीब आकर्षण है
उदाहरण के लिए, मेरे बनाए QWOP clone में पैर helicopter की तरह घूमते हुए उसे आसमान में उड़ा ले जाते हैं। यह इरादतन नहीं था, लेकिन शानदार लगा
इसलिए मैं जानबूझकर bugs को mechanical तरीके से फिर से introduce करने वाले experiments कर रहा हूँ। अभी तक नतीजे बेतुके ही हैं, लेकिन दिलचस्प हैं
थोड़ा chaos जानबूझकर डालने वाला LLM बनाना मुश्किल नहीं होगा, लेकिन मैं सटीक output को ज़्यादा पसंद करता हूँ