नमस्कार। आज मैं आपके लिए एक ऐसी खबर लेकर आया हूँ जो दिलचस्प भी है और चिंताजनक भी। यह सामने आया है कि Anthropic का जनरेटिव AI मॉडल Claude चीन के अंडरग्राउंड बाज़ार में आधिकारिक कीमत के लगभग 10% पर, यानी 90% छूट के साथ बेचा जा रहा है। अगर यह सिर्फ अवैध रीसेलिंग होती, तो बात वहीं तक रहती, लेकिन असली समस्या कुछ और बताई जा रही है। दरअसल, इसका इस्तेमाल उपयोगकर्ताओं के prompt डेटा को निकालकर दूसरे AI मॉडलों की ट्रेनिंग के लिए संपत्ति की तरह करने के रास्ते के रूप में हो रहा है。
90% छूट आखिर संभव कैसे हुई?
Oxford China Policy Lab की शोधकर्ता Zhilan Chen द्वारा हाल ही में जारी "API Proxy Economy" की स्थिति रिपोर्ट के अनुसार, स्थानीय स्तर पर 'relay stations' कहलाने वाले proxy नेटवर्क GitHub, Telegram, Taobao आदि पर लगभग खुलेआम चल रहे हैं।
कीमत को इतना नीचे लाने के तरीके आमतौर पर ये हैं।
बड़े पैमाने पर free trial accounts बनाकर API access को फिर से बेचना
चोरी किए गए credit cards से paid plans लेना और access को कई लोगों में बाँटना
लगभग $200 प्रति माह वाले Max plan को कई उपयोगकर्ताओं में बाँटकर बेचना
एक कदम आगे बढ़कर 'model switching' — उपयोगकर्ता यह मानता है कि वह सबसे उन्नत मॉडल Claude Opus इस्तेमाल कर रहा है, लेकिन वास्तव में जवाब सस्ते Haiku या open source मॉडल से लौटाए जाते हैं; ऐसे मामले भी सामने आए हैं
प्रदर्शन आधे से भी कम निकला
जर्मनी के CISPA Helmholtz Center for Information Security के शोधकर्ताओं ने 17 proxy services का विश्लेषण किया। मेडिकल क्षेत्र के benchmark के आधार पर आधिकारिक API ने लगभग 84% accuracy दिखाई, जबकि proxy services केवल 37% तक ही पहुँचीं। यानी, जितनी कीमत बची, उतनी ही आउटपुट की गुणवत्ता भी बुरी तरह गिर गई — यह बात अब वस्तुनिष्ठ आँकड़ों से भी स्पष्ट हो गई है।
असल निशाना था 'prompt डेटा'
उद्योग जिस हिस्से को अधिक गंभीर मान रहा है, वह कुछ और है। proxy operators उपयोगकर्ताओं के prompts, AI के answers, और यहाँ तक कि reasoning process (Chain of Thought, CoT) तक को store करके, उन्हें प्रोसेस कर ट्रेनिंग datasets के रूप में बेच रहे हैं।
सोचिए, उन्नत AI उपयोगकर्ताओं द्वारा बारीकी से तैयार किए गए prompts और chain-of-thought डेटा, मॉडल की performance बेहतर करने के लिए बेहद मूल्यवान संपत्ति होते हैं। हाल के समय में चीनी AI मॉडलों की reasoning क्षमता तेज़ी से बढ़ने के पीछे ऐसी डेटा-संग्रह संरचना का भी कुछ योगदान हो सकता है, ऐसी विश्लेषणात्मक राय सामने आ रही है।
वास्तव में, Anthropic ने इसी साल फ़रवरी में बताया था कि DeepSeek, Moonshot AI, MiniMax जैसी चीनी कंपनियों से जुड़े होने का संदेह वाले लगभग 24,000 fraudulent accounts से 1.6 करोड़ से अधिक queries उत्पन्न हुई थीं।
source code लीक होने का और बड़ा साया
सुरक्षा के लिहाज़ से चिंताएँ भी साथ-साथ बढ़ रही हैं। आजकल डेवलपर्स अक्सर AI coding agents में source code के साथ-साथ API structure और internal authentication information तक डालकर काम करते हैं। लेकिन यदि यह सब किसी unverified proxy server से होकर गुज़रे, तो कंपनी की आंतरिक जानकारी भी ज्यों की त्यों बाहरी सर्वर तक पहुँच सकती है — ऐसा चेतावनी दी जा रही है।
Chen शोधकर्ता ने समझाया, "किसी unverified proxy के ज़रिए AI service का इस्तेमाल करना, व्यवहार में गोपनीय डेटा को किसी third-party server पर भेजने जैसा ही है।"
समापन
यह मामला सिर्फ अवैध वितरण का नहीं है; इससे यह भी संकेत मिलता है कि AI युग में एक नया 'डेटा चोरी बाज़ार' आकार ले रहा है। अगर आपको कोई सस्ता API gateway दिखे, तो उसके पीछे वास्तव में क्या हो रहा है, इस पर कम से कम एक बार संदेह करना ज़रूरी है। खासकर यदि आप coding agent के साथ कंपनी का code संभालते हैं, तो यह दोबारा जाँचना बेहतर होगा कि आपका traffic आखिर कहाँ जा रहा है।
स्रोत: KMJ — https://www.kmjournal.net/news/articleView.html?idxno=11241
8 टिप्पणियां
भोले-भाले लोग बहुत हैं।
हैरान करने वाला है.. क्या यह असल में लगभग हैकिंग के स्तर का नहीं है?
OpenRouter में तो कोई समस्या नहीं होगी, है ना? -.-
वह आधिकारिक है, इसलिए शायद कोई समस्या नहीं होगी।
वाकई दुखद है कि वे इतनी बेशर्मी से ऐसे काम कर रहे हैं..
हह
उफ़..
लगता है ठग ही ठगे गए