फ्रंटियर का अंत
(tanyaverma.sh)- Anthropic की Mythos घोषणा के बाद, इंटरनेट अब ऐसा बिना अनुमति वाला रचनात्मक स्पेस नहीं रहा जहाँ कोई भी स्वतंत्र रूप से खोजबीन कर सके
- श्रम और बुद्धिमत्ता को पूंजी से प्रतिस्थापित किया जा रहा है, और इससे कुछ कंपनियों की AI युग में स्थायी बढ़त वाली संरचना मजबूत हो रही है
- क्लोज्ड मॉडल नीतियाँ और API access सीमाएँ सुरक्षा के नाम पर लाई जाती हैं, लेकिन नतीजतन innovation और safety research दोनों दबते हैं
- बुद्धिमत्ता तक पहुँच का बुनियादी सिद्धांत ‘access first’ होना चाहिए, और कंपनियों को पारदर्शी प्रक्रियाएँ और auditability सुनिश्चित करनी चाहिए
- पूरी मानवता के डेटा पर प्रशिक्षित मॉडलों पर कुछ लोगों का कब्ज़ा औपनिवेशिक value extraction संरचना जैसा है; इंटरनेट की openness और creativity की रक्षा की जानी चाहिए
फ्रंटियर का अंत
- Anthropic की Mythos घोषणा के बाद, इंटरनेट अब ऐसा बिना अनुमति वाला स्पेस नहीं रहा जहाँ कोई भी स्वतंत्र रूप से खोज और सृजन कर सके
- पहले पूंजी या नेटवर्क के बिना भी कोई भी इंटरनेट और उसी तकनीकी इन्फ्रास्ट्रक्चर तक पहुँच सकता था, लेकिन अब ओपन मॉडल और क्लोज्ड मॉडल के बीच का अंतर बढ़ता जा रहा है
- इसे अमेरिका के frontier युग के अंत की तरह अवसरों के अंत के रूप में देखा गया है
- श्रम और बुद्धिमत्ता को पूंजी से प्रतिस्थापित करने वाली संरचना गहरी होती जा रही है, जिससे पूंजी रखने वाले समूह AI युग में स्थायी बढ़त हासिल कर सकते हैं
- Rudolf Laine ने इसे “ऐसा युग जिसमें पूंजी अतिमानवीय श्रम में बदल जाती है” कहा, और George Hotz ने इसे ‘neofeudalism’ नाम दिया
- चेतावनी यह है कि यदि बेहद कम कंपनियाँ बुद्धिमत्ता पर ही एकाधिकार जमा लें, तो बाकी लोग स्थायी निचले वर्ग में धकेले जा सकते हैं
- Anthropic की Mythos को क्लोज्ड रखने की नीति को केवल सुरक्षा उपाय नहीं, बल्कि निजी कंपनियों द्वारा राज्य-स्तरीय क्षमताओं पर कब्ज़ा करने वाली संरचना के रूप में आलोचना मिली है
- Anthropic ने AWS, Apple, Google आदि के साथ Project Glasswing की घोषणा की, लेकिन सार्वजनिक रिलीज़ के बिना केवल कॉर्पोरेट पार्टनर्स को access दिया
- इससे security incidents या information leaks की स्थिति में जोखिम बढ़ता है, और राज्य-स्तरीय क्षमताएँ निजी कंपनियों में सिमटने जैसी अलोकतांत्रिक स्थिति बनती है
- API access सीमाएँ दुरुपयोग रोकने में मदद कर सकती हैं, लेकिन साथ ही innovation और safety research को दबाती भी हैं
- खुली पहुँच मॉडल की संभावित क्षमताओं को सामने लाती है और वास्तविक वातावरण में ‘जल्दी विफल होना और सुधार करना’ संभव बनाती है
- जैसे पहले fuzzer tool (American Fuzzy Lop) के उपयोग ने security को मजबूत किया था, वैसे ही frontier मॉडलों की पहुँच बढ़ाना security capabilities को बेहतर बना सकता है
- लेकिन अभी AI safety researchers बड़े मॉडलों तक पहुँच न होने के कारण अधिकतर चीनी open source models का उपयोग कर रहे हैं
- बुद्धिमत्ता तक पहुँच का मूल सिद्धांत ‘access first’ होना चाहिए, और सुरक्षा उपाय उसके ऊपर जोड़े जाने चाहिए
- जिन कंपनियों के पास सरकार-स्तर की क्षमताएँ हैं, उन्हें निष्पक्ष प्रक्रियाएँ और पारदर्शी मानदंड बनाने चाहिए, और access सीमित करने पर स्पष्ट कारण सार्वजनिक करने चाहिए
- frontier मॉडल access छिन जाना सामाजिक बहिष्करण के उस रूप जैसा है जिसे ‘unbanked’ स्थिति कहा जाता है
- FOIA स्तर की audit बाध्यता आवश्यक है
- पूरी मानवता के डेटा पर प्रशिक्षित मॉडलों पर कुछ कंपनियों का एकाधिकार औपनिवेशिक value extraction संरचना जैसा है
- जिन लोगों ने डेटा दिया, उनसे सहमति के बिना value निकाली जाती है, और लाभ आंतरिक नेटवर्कों में केंद्रित हो जाता है
- बाद में UBI या philanthropic donations के ज़रिये नैतिक वैधता बनाने का पैटर्न दोहराया जाता है
- इरादा दुष्ट न भी हो, सत्ता के केंद्रीकरण की संरचनात्मक समस्या वही रहती है
- AI के personalization की संभावना को लेकर आशा भी जताई गई है
- मौजूदा बंद AI युग शायद सिर्फ mainframe era हो, और personal computing (Apple II) जैसे दौर में बदलाव की संभावना मौजूद है
- open source models पहले ही 3~12 महीनों के अंतर तक frontier की बराबरी की दिशा में बढ़ रहे हैं, और यदि chips तथा energy supply का विस्तार होता है, तो ‘इतनी सस्ती बुद्धिमत्ता कि उसका मापन कठिन हो’ वाला युग आ सकता है
-
‘Wired’ की आज़ादी नहीं खोनी चाहिए
- जैसे शहर सुरक्षा के नाम पर पुराने पेड़ काट देते हैं, वैसे ही अत्यधिक सुरक्षा तर्क के कारण इंटरनेट की openness और creativity खोने का खतरा है
- इंटरनेट अब भी व्यक्ति-नेतृत्व वाली रचना और खोज का आख़िरी स्पेस है, और इसकी रक्षा करना महत्वपूर्ण है
13 टिप्पणियां
यह मार्केटिंग वाला बढ़ा-चढ़ाकर किया गया दावा लगता है। हर बार नया मॉडल आते ही कहा जाता है कि यह अब तक का सबसे बड़ा है, मानव युग का अंत है, अब coding खत्म हो गई है इसलिए plumbing करनी चाहिए, वगैरह-वगैरह—ऐसे नए-नए अतिशयोक्तिपूर्ण जुमले बहुत रहे हैं। लेकिन असल इस्तेमाल में दिक्कतें रहीं, और सबसे अहम बात यह है कि ज़्यादातर लोग अभी भी सिर्फ़ एक उन्नत search engine इस्तेमाल करने के स्तर पर ही रुके हुए हैं, इसलिए वे शक्तिशाली मॉडल का 100% output निकाल ही नहीं पाते। LLM युग का bottleneck न code है, न infrastructure, बल्कि विडंबना यह है कि prompt भेजने वाली आम जनता की information systems के बारे में कम समझ ही असली bottleneck है।
आजकल 31b मॉडल्स रिलीज़ होते देख कर काफ़ी जबरदस्त लग रहा है... अभी तक तो लगता है कि थोड़ी उम्मीद बाकी है
Hacker News की राय
इसे घोषित हुए अभी सिर्फ़ एक हफ़्ता हुआ है, और इतनी जल्दी ऐसी चर्चा शुरू हो जाना मुझे बहुत जल्दबाज़ी लगता है
“यह मॉडल आम जनता के लिए बहुत ज़्यादा शक्तिशाली है” सुनने में एक marketing phrase जैसा लगता है
कुछ महीनों बाद वे फिर कोई दूसरा मॉडल बेचेंगे, और उसके बाद शायद कहेंगे “नया मॉडल इतना शक्तिशाली है कि इसे सार्वजनिक नहीं किया जा सकता”
कहा जा रहा है कि Mythos इतना धीमा है कि interactive coding के लिए उपयुक्त नहीं है। अगर नतीजा आने में पूरी रात लग जाए, तो ज़्यादातर users के लिए उसे इस्तेमाल करने की खास वजह नहीं बचेगी
AI labs अभी भी घाटे में चल रही हैं, और Mythos को उपलब्ध कराने के लिए उन्हें काफ़ी ज़्यादा कीमत रखनी पड़ेगी। अगर ज़्यादातर customers उस फ़र्क़ को महसूस ही न कर सकें, तो इसमें आर्थिक तुक नहीं है
शायद Anthropic, OpenAI की तुलना में अपने training data center access का बेहतर उपयोग करना चाहता हो। लेकिन अभी ज़रूरत ज़्यादा स्मार्ट मॉडल की नहीं, बल्कि छोटे, सस्ते और काफ़ी अच्छे मॉडल की है
Mythos भी उस समय से बहुत अलग नहीं लगता
AI development को धीमा करना चाहने वाले लोगों ने ही इस विमर्श को फैलाकर ध्यान खींचा, और नतीजतन AI के प्रसार में योगदान दिया
2011 के आसपास इस तरह की घटना पर एक दिलचस्प अध्ययन भी था, जिसमें स्वीडिश brand Cheap Monday का मामला याद आता है
वह शायद मानता है कि access को सीमित करना ही security का मूल है
लेकिन अगर इस रवैये का नतीजा यह हो कि कुछ लोगों को ही लाभ मिले और बहुसंख्यक लोग बाहर रह जाएँ, तो इसकी वैधता का फ़ैसला जनता को करना चाहिए
अगर ऐसी क्षमता public API के रूप में खोल दी जाए, तो उसके दुरुपयोग की संभावना बहुत ज़्यादा है
AI का इस्तेमाल करके बड़े पैमाने पर fraud और deepfake के कई मामले पहले से मौजूद हैं
अगर open source code पर “संभव सभी vulnerabilities ढूँढो” जैसा निर्देश देने पर यह मौजूदा models से कहीं ज़्यादा नतीजे देता है, तो सीमित release एक तर्कसंगत विकल्प है
Anthropic ने Crowdstrike, Cisco, Microsoft जैसी security companies को ही access दिया है, यह समझ में आता है
अगर Glasswing का उद्देश्य infrastructure security मज़बूत करना है, तो यह अजीब होगा कि किसी security incident का सामना कर चुकी कंपनियों को ही access न दिया जाए
Mythos शायद कभी सार्वजनिक हो जाए, लेकिन यह सीमित release मुझे safe release की तैयारी की प्रक्रिया जैसा लगता है
NVIDIA इस तरह की चिंताओं का समाधान करने के लिए Nemotron विकसित कर रहा है
Nemotron सिर्फ़ open weights ही नहीं, बल्कि open data और open recipe भी जारी करने वाला मॉडल है
लक्ष्य यह है कि कई संस्थान मिलकर open AI बनाएँ
Nemotron 3 Super इस समय सबसे सफल है, और जल्द ही Ultra और Nemotron 4 भी आने वाले हैं
AI जितना बढ़ेगा, NVIDIA के अवसर भी उतने बढ़ेंगे, इसलिए यह उसके लिए संभव रणनीति है
संबंधित लिंक
“वह दौर जब 16 साल का कोई लड़का भी बिना पूँजी के कुछ बना सकता था” — यह बात आज शायद और भी ज़्यादा सच लगती है
Anthropic के Mythos को सार्वजनिक न कर पाने की वजह computing resources की कमी है
OpenAI इस साल और अगले साल कहीं ज़्यादा computing power हासिल करने वाला है
इस बात से कि Mythos दूसरे models से इतना अलग नहीं है, मैं “अभी बहुत जल्दी है” वाली राय से सहमत हूँ
हालाँकि AI critics का यह फ़्रेम कि “बड़ी कंपनियों ने समाज को लूट लिया” शायद intellectual property की अवधारणा की ग़लतफ़हमी से पैदा हुआ है
Anthropic अगर Mythos को छिपाने के बजाय उसे enterprise security audit service की तरह इस्तेमाल करे, तो बेहतर होगा
अगर वह infrastructure पर हमला करके vulnerabilities ढूँढने वाली service हो, तो उसकी कमाई की संभावना भी काफ़ी होगी
उदाहरण के लिए, अगर किसी लोकप्रिय npm package के maintainer को पैसों की ज़रूरत हो और वह Mythos से अपनी library की जाँच करवाए, और एक महीने बाद hack हो जाए, तो बहुत बड़ा विवाद खड़ा हो जाएगा
“power grid” वाली उपमा प्रभावशाली लगी
solar की तरह व्यक्ति खुद भी बिजली पैदा कर सकता है, लेकिन ज़्यादातर लोग public utility को भुगतान करके बिजली इस्तेमाल करते हैं
उसी तरह intelligence तक पहुँच भी मूल रूप से सबके लिए खुली होनी चाहिए
ख़तरनाक इस्तेमाल को safety measures से सीमित किया जा सकता है, लेकिन default access allow होना चाहिए
मानवता हमेशा ‘राक्षसी तकनीक’ को ज़रूरी चीज़ में बदल देने के प्रलोभन में फँसती रही है
लेकिन ऐसे राक्षस को ज़्यादा समय तक बंद नहीं रखा जा सकता। आखिरकार वह नियंत्रण से बाहर हो जाता है
अमेरिकी frontier युग के अवसर एक अपवाद थे
तेज़ विस्तार के दौर में व्यक्ति आगे बढ़ सकता था, लेकिन ठहराव आते ही कंपनियाँ व्यक्ति पर हावी हो जाती हैं
technology development जितनी तेज़ होती जा रही है, व्यक्ति के पास दुनिया को तबाह कर सकने लायक शक्ति भी उतनी ही पहुँच रही है
परमाणु हथियारों की तरह, AI भी अब उस मोड़ पर पहुँच रहा है जहाँ व्यक्तिगत पहुँच पर सीमा ज़रूरी हो सकती है
सफल होने के लिए सेवा का किसी celebrity से जुड़ा होना लगभग ज़रूरी है
वैसे भी सारे प्रतिस्पर्धी इसे कॉपी कर ही लेंगे lol "अब लड़ो"
लेकिन यह कोई नया कॉन्सेप्ट तो नहीं होगा?
फाइनेंस सेक्टर में भी एक ऐसी financial hub मौजूद है जो सभी देशों के कानूनों से ऊपर है, और वहीं से पूरी वित्तीय व्यवस्था नियंत्रित होती है।
अब IT में भी शायद वैसा ही IT hub बन रहा है, जहाँ IT कंपनियाँ आपस में मिलकर नियंत्रण करें और सभी देशों के मुकाबले खड़ी हों।
और Claude की performance देखें तो यह बात समझ में आती है।
क्या आपका मतलब financial hub से है, जैसे यहूदी network जैसे किसी खास समूह की बात, या फिर Hong Kong, Singapore जैसे सिर्फ़ साधारण intermediary hubs की?
SWIFT या payment clearing जैसी संरचनाएं दरअसल बड़े देशों के ही नियंत्रण में हैं, ऐसा मानना चाहिए।
यह उनका मुकाबला करने के बजाय, बल्कि ज़्यादा ताकतवर पक्ष के tool के रूप में इस्तेमाल होने की तरफ़ रहता है।
मुझे उस नज़रिए से देखें तो यह लेख भी आखिरकार ताकतवर लोगों का tool बन जाना ही अपने मूल उद्देश्य के हिसाब से ज़्यादा स्वाभाविक लगता है।
मुझे लगता है कि अभी भी इसमें मार्केटिंग का असर कुछ ज़्यादा है।
वैसे, अगर अत्यधिक रूप से लगभग असीमित क्षमताओं वाला कोई मॉडल बना लिया जाए, तो ऐसा भी लग सकता है कि उसे सार्वजनिक करने की कोई वजह नहीं होगी। क्योंकि वह मॉडल अपने उपयोग शुल्क से भी अधिक अतिरिक्त मूल्य खुद ही पैदा कर सकता होगा...
अगर इसे ठीक से सार्वजनिक करने के लिए मजबूर किया जाए, तो उल्टा श्रम और बुद्धिमत्ता के प्रतिस्थापित होने के साथ इतिहास में एक भी बार अस्तित्व में न आ सकने वाला साम्यवाद वास्तविकता बन सकता है।
यह ऐसा अच्छा लेख है जो उन पहलुओं की ओर इशारा करता है जिनके बारे में मैंने सोचा नहीं था। धन्यवाद!
GLM5.1 जैसी चीज़ों को देखकर मुझे लगा कि open model, भले ही थोड़ा gap रहे, फिर भी paid closed model का लगातार पीछा कर सकते हैं।
लगता है यह पहले से ही तय था.. तकनीक जादू बन जाती है और कुछ ही जादूगर सब कुछ अपने कब्जे में कर लेते हैं..
b2b का आविष्कार Anthropic ने किया?