- Microsoft अपने अधिकांश Claude Code direct licenses रद्द कर रहा है और engineers को GitHub Copilot CLI पर शिफ्ट कर रहा है, ताकि internal AI tools की लागत कम की जा सके
- Claude Code को हजारों कर्मचारियों को coding experiments के लिए देने के बाद यह तेजी से लोकप्रिय हुआ, लेकिन उपयोग का पैमाना बढ़ने के साथ लागत का दबाव भी बढ़ा
- Uber ने 2026 के लिए AI coding tools का पूरा बजट सिर्फ 4 महीनों में खत्म कर दिया, और team-wise AI tool usage को बढ़ावा देने के लिए internal leaderboard का इस्तेमाल किया
- कंपनियां productivity बढ़ाने के लिए token usage जितना बढ़ाती हैं, token की unit cost घटने पर भी कुल bill और बड़ा हो सकता है
- Goldman Sachs का मानना है कि agentic AI, 2030 तक token consumption को 24 गुना बढ़ा सकता है, और Gartner का भी कहना है कि consumption growth, unit price गिरावट से आगे निकल सकती है
कंपनियों के भीतर AI के बढ़ते इस्तेमाल और लागत का दबाव
- Microsoft ने The Verge की रिपोर्ट के बाद अपने अधिकांश Claude Code direct licenses रद्द करना शुरू कर दिया है, और engineers को GitHub Copilot CLI पर शिफ्ट किया जा रहा है
- Claude Code access 6 महीने पहले developers, project managers, designers समेत हजारों कर्मचारियों को coding experiments के लिए दिया गया था और यह जल्दी लोकप्रिय हो गया, लेकिन उपयोग का पैमाना बढ़ने के साथ लागत की समस्या उभरकर सामने आई
- Claude Code licenses रद्द होने का Microsoft के Foundry contract पर कोई असर नहीं पड़ता
- इस contract में Anthropic में अधिकतम $5 billion का निवेश, Foundry customers के लिए Claude models की access, और Anthropic द्वारा Azure compute capacity में $30 billion की खरीद प्रतिबद्धता शामिल है
- Uber के CTO Praveen Neppalli Naga ने The Information को बताया कि Uber ने 2026 के AI coding tools budget का पूरा हिस्सा सिर्फ 4 महीनों में पहले ही खर्च कर दिया
- Uber, team-wise AI tool usage को rank करने वाले internal leaderboard के जरिए adoption को सक्रिय रूप से बढ़ावा दे रहा है
- Nvidia के applied deep learning के VP Bryan Catanzaro ने Axios इंटरव्यू में कहा, “मेरी टीम में compute cost, employee cost से बहुत ज्यादा है”
- Anthropic ने Fortune की comment request का तुरंत जवाब नहीं दिया, और Microsoft ने भी कोई comment जारी नहीं किया
सस्ते token कैसे बड़े bill में बदल जाते हैं
- कंपनियां productivity बढ़ाने के लिए कर्मचारियों के AI usage expansion को जोर से आगे बढ़ा रही हैं, लेकिन token-based billing में usage बढ़ने के साथ कुल लागत भी बढ़ती है
- Meta के एक कर्मचारी ने Anthropic model के नाम पर “(Claudeonomics)” leaderboard बनाया, जिससे employee-wise AI usage को track किया जा सके
- Amazon कर्मचारियों को “tokenmaxxing” के लिए प्रोत्साहित कर रहा है, जिसका मतलब है AI compute की बुनियादी इकाई token का जितना संभव हो उतना अधिक इस्तेमाल करना
- Goldman Sachs का अनुमान है that consumers और enterprises द्वारा AI agents अपनाने से agentic AI 2030 तक token consumption को 24 गुना बढ़ाकर प्रति माह 120 decillion tokens तक पहुंचा सकता है
- Gartner का मानना है कि 2030 तक 1 trillion-parameter LLM की inference cost, 2025 की तुलना में लगभग 90% कम हो जाएगी, लेकिन उसका अनुमान है कि सस्ते token सीधे कंपनियों के AI cost savings में नहीं बदलेंगे
- agentic models को standard models की तुलना में प्रति task कहीं ज्यादा tokens की जरूरत होती है
- consumption growth, unit price गिरावट से आगे निकल सकती है
- AI providers, कम हुई लागत का पूरा फायदा consumers तक शायद न पहुंचाएं
- Gartner के senior director analyst Will Sommer ने चेतावनी दी, “CPOs को general-purpose token deflation को frontier inference के democratization के साथ भ्रमित नहीं करना चाहिए”
- Nvidia के CEO Jensen Huang ने कहा था कि एक दिन हर employee के साथ 100 AI agents काम करेंगे, लेकिन अगर token consumption, unit price गिरावट से तेज बढ़ता है, तो यह agentic future executives की उम्मीद से कहीं ज्यादा भारी लागत लेकर आ सकता है
1 टिप्पणियां
Hacker News टिप्पणियाँ
मूल लेख पर सक्रिय चर्चा यहाँ है: https://news.ycombinator.com/item?id=48238896
लेख में कहा गया है, “The Verge ने रिपोर्ट किया कि Microsoft ने Claude Code की डायरेक्ट लाइसेंसिंग का अधिकांश हिस्सा रद्द करना शुरू कर दिया है”
“token-based pricing में आप जितना ज़्यादा इस्तेमाल करते हैं और efficiency जितनी बेहतर होती है, यह उतना महंगा हो जाता है” वाला हिस्सा भी अजीब है। समझ नहीं आता कि efficiency बेहतर होने पर लागत क्यों बढ़ेगी
शीर्षक भ्रामक लगता है, और लेख पढ़ने पर वजह और साफ़ हो जाती है। इन कंपनियों में जितने हो सकें उतने tokens जलाओ जैसे बेतुके OKR और लक्ष्य हैं
अगर token usage को metric बना दिया जाए, तो नतीजा स्वाभाविक रूप से बहुत महंगा होगा
inference cost अपने आप में संभालने लायक है, और इस तकनीक को उपयोगी बनाने के लिए ज़रूरी नहीं कि सबसे नया proprietary model ही चाहिए। मानव engineers काफ़ी समय तक और ज़रूरी रहेंगे, लेकिन मैं इससे सहमत नहीं हूँ कि “कुछ इंसान + LLM” सिर्फ़ और इंसान भर्ती करने से ज़्यादा महंगा होगा, या लगातार ज़्यादा महंगा ही बना रहेगा
अभी vibe coding से ज़्यादा vibe leadership समस्या लगती है, और vibe leadership का AI से मूल रूप से कोई लेना-देना नहीं है। ऐसे लोग जो एक अस्पष्ट gut feeling पकड़ लेते हैं और फिर लागत या नतीजों की परवाह किए बिना उसे अलौकिक निष्कर्षों तक धकेलते रहते हैं
इस लेख का आधार ही ग़लत है। Microsoft ने अंदरूनी Claude Code उपयोग इसलिए रद्द नहीं किया कि AI की लागत बहुत ज़्यादा है, बल्कि इसलिए कि उसके पास प्रतिस्पर्धी उत्पाद GitHub Copilot है और वह चाहता है कि कर्मचारी उसका अपना उत्पाद इस्तेमाल करें
lockdown के दौरान Teams को इतनी तवज्जो मिलने की वजह भी यही थी
लेकिन वह टीम software development के लिए LLM इस्तेमाल नहीं करती, वह सचमुच deep learning टीम है, और deep learning development style में computing जलाने वाली टीम है
थोड़ा सा हिसाब लगाने पर भी दिख जाता है कि Microsoft AI पर developers से ज़्यादा पैसा नहीं दे सकता। product development भूमिकाओं में लगभग 80,000 कर्मचारी हैं, और senior developers की कुल लागत शायद लगभग $400,000 होगी
क्या Microsoft के पास $32 billion का Claude bill है? शायद नहीं
हाँ, lockdown के समय Teams को ध्यान मिलने वाला उदाहरण पहले दावे के समानांतर कैसे है, यह पूरी तरह स्पष्ट नहीं है
लेख में कहीं भी यह नहीं कहा गया कि Microsoft ने रिपोर्ट किया कि AI मानव कर्मचारियों से ज़्यादा महंगा है
भले ही Microsoft ने इसे स्पष्ट रूप से न कहा हो, लेकिन यह बात फिर भी सामने आती है कि AI ज़्यादा महंगा है
tokenmaxxing ट्रेंड शायद इस AI लहर से निकला सबसे मूर्खतापूर्ण विचारों में से एक है। यह efficiency और productivity को अधिकतम करने के बिल्कुल उलट जाता है, फिर भी व्यापक रूप से स्वीकार किया जा रहा है
http://archive.today/l3EEo
Microsoft ने Claude को इसलिए रद्द किया क्योंकि Copilot उतना अच्छा नहीं है, इसलिए Copilot को ज़बरदस्ती इस्तेमाल कराया जाना है। यह अंदर की बात के तौर पर स्वीकार किया जा चुका है, कोई रहस्य नहीं है
अभी Anthropic tokens पर subsidy थी, इसलिए Microsoft के नज़रिए से यह उल्टा और महंगा भी हो गया होगा
AI उपयोग की लागत का विश्लेषण करने के लिए उसके उपयोग के संदर्भ को देखना चाहिए
बहुत से लोग AI का इस्तेमाल documents, Slack बातचीत, और emails को सजाने-सँवारने के लिए, या छोटे prompts से बेवजह बड़े documents बनवाने के लिए कर रहे हैं। कंपनी के भीतर Slack message या email भेजने के लिए AI की ज़रूरत होने की कोई वजह नहीं थी। यह resources और समय बर्बाद करना है, सिर्फ़ चीज़ों को ज़्यादा polished दिखाने के लिए, बिना अर्थ में कोई बड़ा बदलाव किए
tokens जलाना उतना ही आसान है जितना पैसे को भट्ठी में फेंकना
token usage productivity का अच्छा metric नहीं है। समस्या यह है कि productive AI usage को कैसे मापा जाए, यह अभी तक किसी ने ठीक से नहीं समझा है। यह अलग करना मुश्किल है कि developers productivity maximize कर रहे हैं, सिर्फ़ tokens जला रहे हैं, या बदलाव का विरोध कर रहे हैं
AI मानव कर्मचारियों को वेतन देने से महंगा नहीं है। अभी AI मानव कर्मचारियों की जगह ले ही नहीं सकता, इसलिए शीर्षक का आधार ही ग़लत है