टोपी पहनने और चाबुक इस्तेमाल करने वाले पुरातत्वविद् साहसी की छवि
(theaiunderwriter.substack.com)GPT इमेज जनरेशन और कॉपीराइट समस्या की पड़ताल
- GPT इमेज जनरेशन फीचर के अपडेट के बाद, इंटरनेट उपयोगकर्ताओं के बीच तरह-तरह के कंटेंट को Studio Ghibli शैली में बदलने का ट्रेंड फैल गया
- प्रमुख उदाहरण के तौर पर, meme ‘Disaster Girl’ को Ghibli शैली में दोबारा रचा गया चित्र
- यह इस तकनीकी प्रगति का भी उदाहरण है कि AI बेहद श्रम-गहन कला शैली को आसानी से पुनर्निर्मित कर सकता है
- लेकिन साथ ही, यह असहजता भी मौजूद है कि यह मूल रचनाकार की विशिष्ट संवेदना और मानवता को हटाकर किया गया ‘अनुकरण’ लगता है
- अनुकरण और रचनात्मकता
- Coco Chanel ने कहा था कि अनुकरण से बुरा कुछ नहीं, और Orson Welles ने कहा कि रचनात्मकता अनुकरण से अधिक मूल्यवान है।
- Wilson Mizner ने कहा था कि एक चीज़ की नकल करो तो वह plagiarism है, लेकिन दो चीज़ों की नकल करो तो वह research है।
Studio Ghibli शैली की जटिल भावनाएँ
- Studio Ghibli एक animation studio है जो अपनी कारीगरी के लिए मशहूर है, और सिर्फ 4 सेकंड के दृश्य पर 1 साल से अधिक काम भी करता है
- GPT के ज़रिए Ghibli-करण, इस कलात्मक समर्पण का अनुकरण भी करता है और गति व दक्षता के ज़रिए उसका व्यंग्यात्मक रूप भी बना देता है
- AI के प्रति सांस्कृतिक संदेह भी सामने आता है कि वह मानवीय संवेदना और अनुभव के बिना सिर्फ शैली की नकल कर रहा है
GPT का IP बाइपास प्रयोग
- लेखक ने GPT से कॉपीराइट-संरक्षित IP का सीधे उल्लेख किए बिना, परोक्ष रूप से वर्णित prompt के माध्यम से चित्र बनवाए
- उदाहरण: “टोपी पहनने और चाबुक इस्तेमाल करने वाला पुरातत्वविद् साहसी” → Indiana Jones की याद दिलाने वाली छवि बनी
- “खोपड़ी जैसे चेहरे वाले खलनायक से लड़ता हुआ मांसल आदमी” → He-Man जैसी छवि सामने आई
- यह प्रक्रिया इस बात का प्रयोगात्मक नतीजा थी कि AI कितनी आसानी से मौजूदा IP का ‘अनुकरण’ कर सकता है
- सिर्फ prompt के आधार पर भी AI किसी खास character या शैली को काफी सटीक रूप से पुनर्निर्मित कर सकता है, जिससे कॉपीराइट बाइपास को लेकर चिंता उठती है
कॉपीराइट और अनुकरण की सीमा
- GPT ने training के दौरान अनगिनत visual styles सीखी हैं, और ये अक्सर कॉपीराइट वाली छवियों से निकली हुई होती हैं
- Business Insider के अनुसार, “शैली का अनुकरण कॉपीराइट कानून के तहत अनुमत हो सकता है”
- लेकिन GPT का अनुकरण सिर्फ style copy से आगे बढ़कर व्यावहारिक रूप से समान या बहुत मिलते-जुलते characters बनाने तक पहुँच जाता है
LLM द्वारा बनाए गए ‘प्लेटोनिक आदर्श’
- GPT द्वारा बनाई गई छवियाँ अक्सर “आदर्श रूप” के करीब होती हैं, और वास्तविक search results की तुलना में और अधिक सारतत्व के करीब visual देती हैं
- उदाहरण: “ब्रिटिश जासूस” की छवि → Craig/Brosnan शैली के 007 की याद दिलाने वाला परिणाम
- इससे यह दिलचस्प बात सामने आती है कि LLM मनुष्यों की तरह सीखते हैं और हमारी तरह संज्ञानात्मक पैटर्न बनाते हैं
AI की प्रगति और कॉपीराइट बहस का भविष्य
- GPT एक ऐसी तकनीक है जो कॉपीराइट उल्लंघन की संभावना के साथ-साथ आश्चर्यजनक रचनात्मक क्षमता भी दिखाती है
- Studio Ghibli शैली के memes का प्रसार यह संकेत देता है कि AI tools मूल कला के सार को क्षतिग्रस्त करते हुए भी उतने ही आकर्षक हो सकते हैं
- उपयोगकर्ताओं को तकनीकी प्रगति के लाभ लेने के साथ-साथ यह भी समझने की ज़रूरत है कि यह बौद्धिक संपदा की सीमाओं को धुंधला कर रहा है
निष्कर्ष: यह चुनाव हमारे हाथ में है
- AI लगातार अधिक परिष्कृत तरीके से रचना का ‘अनुकरण’ कर रचनात्मकता की परीक्षा ले रहा है
- इस तकनीक की दिशा और उसका नैतिक उपयोग उपयोगकर्ताओं और डेवलपर्स की जिम्मेदारी के दायरे में आता है
- पोस्ट के अंतिम उद्धरण की तरह:
"ताकत आपके पास है। रुकिए मत।"
2 टिप्पणियां
AI खुला है लेकिन वास्तव में open नहीं है, और IP को open होना चाहिए.. दूसरों की IP पर train किया गया, लेकिन model अपनी ही IP है? आखिरकार मुझे लगता है कि model को open करना ही सही है। (service layer पर charging)
Hacker News राय
उम्मीद थी कि AI art पर चर्चा intellectual property, royalty systems, और सख्त copyright laws की आलोचना तक पहुँचेगी
इस बारे में राय कि आधुनिक इंटरनेट websites ऐसे मौजूद हैं मानो उनके scroll bars टूटे न हों
IP को ड्रॉ करना या screenshot लेकर Photoshop इस्तेमाल करना अनुमति है
AI model का training data की 1:1 copy बनाना overfitting का गंभीर मामला लगता है
AI द्वारा generated character के physical attributes का मूल्यांकन और रूपांतरण करना दिलचस्प हो सकता है
intellectual property के विरोध में रुख
कंपनियों का लोगों को यह विश्वास दिलाने की कोशिश करना कि वे अपने बनाए हर audio या visual output के मालिक हैं और उसे नियंत्रित करते हैं, सही नहीं है
LLM और internet search अलग हैं, लेकिन LLM पूरे internet से सीखते हैं, इसलिए कुछ overlap होना स्वाभाविक है
prompt किसी well-known character की ओर इशारा करता है, और यह स्पष्ट नहीं करता कि मूल रचना नहीं चाहिए