टोपी पहनने और चाबुक इस्तेमाल करने वाले पुरातत्वविद् साहसी की छवि

(substack.com/theaiunderwriter)

4 पॉइंट द्वारा GN⁺ 2025-04-04 | 2 टिप्पणियां | WhatsApp पर शेयर करें

GPT इमेज जनरेशन और कॉपीराइट समस्या की पड़ताल

GPT इमेज जनरेशन फीचर के अपडेट के बाद, इंटरनेट उपयोगकर्ताओं के बीच तरह-तरह के कंटेंट को Studio Ghibli शैली में बदलने का ट्रेंड फैल गया
प्रमुख उदाहरण के तौर पर, meme ‘Disaster Girl’ को Ghibli शैली में दोबारा रचा गया चित्र
यह इस तकनीकी प्रगति का भी उदाहरण है कि AI बेहद श्रम-गहन कला शैली को आसानी से पुनर्निर्मित कर सकता है
लेकिन साथ ही, यह असहजता भी मौजूद है कि यह मूल रचनाकार की विशिष्ट संवेदना और मानवता को हटाकर किया गया ‘अनुकरण’ लगता है
अनुकरण और रचनात्मकता
- Coco Chanel ने कहा था कि अनुकरण से बुरा कुछ नहीं, और Orson Welles ने कहा कि रचनात्मकता अनुकरण से अधिक मूल्यवान है।
- Wilson Mizner ने कहा था कि एक चीज़ की नकल करो तो वह plagiarism है, लेकिन दो चीज़ों की नकल करो तो वह research है।

Studio Ghibli शैली की जटिल भावनाएँ

Studio Ghibli एक animation studio है जो अपनी कारीगरी के लिए मशहूर है, और सिर्फ 4 सेकंड के दृश्य पर 1 साल से अधिक काम भी करता है
GPT के ज़रिए Ghibli-करण, इस कलात्मक समर्पण का अनुकरण भी करता है और गति व दक्षता के ज़रिए उसका व्यंग्यात्मक रूप भी बना देता है
AI के प्रति सांस्कृतिक संदेह भी सामने आता है कि वह मानवीय संवेदना और अनुभव के बिना सिर्फ शैली की नकल कर रहा है

GPT का IP बाइपास प्रयोग

लेखक ने GPT से कॉपीराइट-संरक्षित IP का सीधे उल्लेख किए बिना, परोक्ष रूप से वर्णित prompt के माध्यम से चित्र बनवाए
- उदाहरण: “टोपी पहनने और चाबुक इस्तेमाल करने वाला पुरातत्वविद् साहसी” → Indiana Jones की याद दिलाने वाली छवि बनी
- “खोपड़ी जैसे चेहरे वाले खलनायक से लड़ता हुआ मांसल आदमी” → He-Man जैसी छवि सामने आई
यह प्रक्रिया इस बात का प्रयोगात्मक नतीजा थी कि AI कितनी आसानी से मौजूदा IP का ‘अनुकरण’ कर सकता है
सिर्फ prompt के आधार पर भी AI किसी खास character या शैली को काफी सटीक रूप से पुनर्निर्मित कर सकता है, जिससे कॉपीराइट बाइपास को लेकर चिंता उठती है

कॉपीराइट और अनुकरण की सीमा

GPT ने training के दौरान अनगिनत visual styles सीखी हैं, और ये अक्सर कॉपीराइट वाली छवियों से निकली हुई होती हैं
Business Insider के अनुसार, “शैली का अनुकरण कॉपीराइट कानून के तहत अनुमत हो सकता है”
लेकिन GPT का अनुकरण सिर्फ style copy से आगे बढ़कर व्यावहारिक रूप से समान या बहुत मिलते-जुलते characters बनाने तक पहुँच जाता है

LLM द्वारा बनाए गए ‘प्लेटोनिक आदर्श’

GPT द्वारा बनाई गई छवियाँ अक्सर “आदर्श रूप” के करीब होती हैं, और वास्तविक search results की तुलना में और अधिक सारतत्व के करीब visual देती हैं
उदाहरण: “ब्रिटिश जासूस” की छवि → Craig/Brosnan शैली के 007 की याद दिलाने वाला परिणाम
इससे यह दिलचस्प बात सामने आती है कि LLM मनुष्यों की तरह सीखते हैं और हमारी तरह संज्ञानात्मक पैटर्न बनाते हैं

AI की प्रगति और कॉपीराइट बहस का भविष्य

GPT एक ऐसी तकनीक है जो कॉपीराइट उल्लंघन की संभावना के साथ-साथ आश्चर्यजनक रचनात्मक क्षमता भी दिखाती है
Studio Ghibli शैली के memes का प्रसार यह संकेत देता है कि AI tools मूल कला के सार को क्षतिग्रस्त करते हुए भी उतने ही आकर्षक हो सकते हैं
उपयोगकर्ताओं को तकनीकी प्रगति के लाभ लेने के साथ-साथ यह भी समझने की ज़रूरत है कि यह बौद्धिक संपदा की सीमाओं को धुंधला कर रहा है

निष्कर्ष: यह चुनाव हमारे हाथ में है

AI लगातार अधिक परिष्कृत तरीके से रचना का ‘अनुकरण’ कर रचनात्मकता की परीक्षा ले रहा है
इस तकनीक की दिशा और उसका नैतिक उपयोग उपयोगकर्ताओं और डेवलपर्स की जिम्मेदारी के दायरे में आता है
पोस्ट के अंतिम उद्धरण की तरह:

"ताकत आपके पास है। रुकिए मत।"

2 टिप्पणियां

kandk 2025-04-04

AI खुला है लेकिन वास्तव में open नहीं है, और IP को open होना चाहिए.. दूसरों की IP पर train किया गया, लेकिन model अपनी ही IP है? आखिरकार मुझे लगता है कि model को open करना ही सही है। (service layer पर charging)

GN⁺ 2025-04-04

Hacker News राय

उम्मीद थी कि AI art पर चर्चा intellectual property, royalty systems, और सख्त copyright laws की आलोचना तक पहुँचेगी
- लेकिन ज़्यादातर लोगों को लगता है कि जानकारी को पूरी तरह commercial mechanisms में समाहित हो जाना चाहिए
- यह समझ में नहीं आता कि Disney किसी pixel collection पर मालिकाना हक़ जताकर उस संस्कृति और संचार को सीमित करे जिसका अनुभव आप कर सकते हैं
- अगर Disney कर सकती, तो शायद आप हर बार Mickey Mouse के बारे में सोचने पर भी शुल्क लेती
इस बारे में राय कि आधुनिक इंटरनेट websites ऐसे मौजूद हैं मानो उनके scroll bars टूटे न हों
- अब मैं जा रहा हूँ
IP को ड्रॉ करना या screenshot लेकर Photoshop इस्तेमाल करना अनुमति है
- लेकिन generated IP को बेचना अनुमति नहीं है
- styles ज़्यादा मुक्त हैं: किसी भी style में बेच सकते हैं
- इससे मूल रचना को फ़ायदा होता है, और जब मूल रचयिता नया काम बनाता है तब भी
- किसी re-creation या derivative work को मूल से ज़्यादा लोकप्रिय होने के लिए उससे कहीं बेहतर होना पड़ेगा
AI model का training data की 1:1 copy बनाना overfitting का गंभीर मामला लगता है
- लगता है कम विकसित पीढ़ियाँ कुछ नया बनाने में ज़्यादा बेहतर थीं
- copyright laundering के अलावा, मूल रचना का इस्तेमाल करना बेहतर लगेगा
AI द्वारा generated character के physical attributes का मूल्यांकन और रूपांतरण करना दिलचस्प हो सकता है
- AI का बार-बार 'default person' इस्तेमाल करना अप्रिय लगा
- AI का औसत जवाब देना भयानक है
- जब AI पर decision-making के लिए निर्भरता होती है तो चिंता होती है
intellectual property के विरोध में रुख
- लगता है कि intellectual property अपने इच्छित उद्देश्य को हासिल नहीं करती
कंपनियों का लोगों को यह विश्वास दिलाने की कोशिश करना कि वे अपने बनाए हर audio या visual output के मालिक हैं और उसे नियंत्रित करते हैं, सही नहीं है
- copyright महत्वपूर्ण है, लेकिन उसे हर मामले में लागू नहीं होना चाहिए
LLM और internet search अलग हैं, लेकिन LLM पूरे internet से सीखते हैं, इसलिए कुछ overlap होना स्वाभाविक है
- image search results को बहुत मिलती-जुलती images से बचने के लिए tune किया जाता है
prompt किसी well-known character की ओर इशारा करता है, और यह स्पष्ट नहीं करता कि मूल रचना नहीं चाहिए
- इंसान भी शायद ऐसा ही जवाब देंगे
- मानव भाषा में बहुत सारा implicit context होता है