1 पॉइंट द्वारा GN⁺ 4 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Microsoft अपने अधिकांश Claude Code direct licenses रद्द कर रहा है और engineers को GitHub Copilot CLI पर शिफ्ट कर रहा है, ताकि internal AI tools की लागत कम की जा सके
  • Claude Code को हजारों कर्मचारियों को coding experiments के लिए देने के बाद यह तेजी से लोकप्रिय हुआ, लेकिन उपयोग का पैमाना बढ़ने के साथ लागत का दबाव भी बढ़ा
  • Uber ने 2026 के लिए AI coding tools का पूरा बजट सिर्फ 4 महीनों में खत्म कर दिया, और team-wise AI tool usage को बढ़ावा देने के लिए internal leaderboard का इस्तेमाल किया
  • कंपनियां productivity बढ़ाने के लिए token usage जितना बढ़ाती हैं, token की unit cost घटने पर भी कुल bill और बड़ा हो सकता है
  • Goldman Sachs का मानना है कि agentic AI, 2030 तक token consumption को 24 गुना बढ़ा सकता है, और Gartner का भी कहना है कि consumption growth, unit price गिरावट से आगे निकल सकती है

कंपनियों के भीतर AI के बढ़ते इस्तेमाल और लागत का दबाव

  • Microsoft ने The Verge की रिपोर्ट के बाद अपने अधिकांश Claude Code direct licenses रद्द करना शुरू कर दिया है, और engineers को GitHub Copilot CLI पर शिफ्ट किया जा रहा है
  • Claude Code access 6 महीने पहले developers, project managers, designers समेत हजारों कर्मचारियों को coding experiments के लिए दिया गया था और यह जल्दी लोकप्रिय हो गया, लेकिन उपयोग का पैमाना बढ़ने के साथ लागत की समस्या उभरकर सामने आई
  • Claude Code licenses रद्द होने का Microsoft के Foundry contract पर कोई असर नहीं पड़ता
    • इस contract में Anthropic में अधिकतम $5 billion का निवेश, Foundry customers के लिए Claude models की access, और Anthropic द्वारा Azure compute capacity में $30 billion की खरीद प्रतिबद्धता शामिल है
  • Uber के CTO Praveen Neppalli Naga ने The Information को बताया कि Uber ने 2026 के AI coding tools budget का पूरा हिस्सा सिर्फ 4 महीनों में पहले ही खर्च कर दिया
  • Uber, team-wise AI tool usage को rank करने वाले internal leaderboard के जरिए adoption को सक्रिय रूप से बढ़ावा दे रहा है
  • Nvidia के applied deep learning के VP Bryan Catanzaro ने Axios इंटरव्यू में कहा, “मेरी टीम में compute cost, employee cost से बहुत ज्यादा है”
  • Anthropic ने Fortune की comment request का तुरंत जवाब नहीं दिया, और Microsoft ने भी कोई comment जारी नहीं किया

सस्ते token कैसे बड़े bill में बदल जाते हैं

  • कंपनियां productivity बढ़ाने के लिए कर्मचारियों के AI usage expansion को जोर से आगे बढ़ा रही हैं, लेकिन token-based billing में usage बढ़ने के साथ कुल लागत भी बढ़ती है
  • Meta के एक कर्मचारी ने Anthropic model के नाम पर “(Claudeonomics)” leaderboard बनाया, जिससे employee-wise AI usage को track किया जा सके
  • Amazon कर्मचारियों को “tokenmaxxing” के लिए प्रोत्साहित कर रहा है, जिसका मतलब है AI compute की बुनियादी इकाई token का जितना संभव हो उतना अधिक इस्तेमाल करना
  • Goldman Sachs का अनुमान है that consumers और enterprises द्वारा AI agents अपनाने से agentic AI 2030 तक token consumption को 24 गुना बढ़ाकर प्रति माह 120 decillion tokens तक पहुंचा सकता है
  • Gartner का मानना है कि 2030 तक 1 trillion-parameter LLM की inference cost, 2025 की तुलना में लगभग 90% कम हो जाएगी, लेकिन उसका अनुमान है कि सस्ते token सीधे कंपनियों के AI cost savings में नहीं बदलेंगे
    • agentic models को standard models की तुलना में प्रति task कहीं ज्यादा tokens की जरूरत होती है
    • consumption growth, unit price गिरावट से आगे निकल सकती है
    • AI providers, कम हुई लागत का पूरा फायदा consumers तक शायद न पहुंचाएं
  • Gartner के senior director analyst Will Sommer ने चेतावनी दी, “CPOs को general-purpose token deflation को frontier inference के democratization के साथ भ्रमित नहीं करना चाहिए”
  • Nvidia के CEO Jensen Huang ने कहा था कि एक दिन हर employee के साथ 100 AI agents काम करेंगे, लेकिन अगर token consumption, unit price गिरावट से तेज बढ़ता है, तो यह agentic future executives की उम्मीद से कहीं ज्यादा भारी लागत लेकर आ सकता है

1 टिप्पणियां

 
GN⁺ 4 시간 전
Hacker News टिप्पणियाँ
  • मूल लेख पर सक्रिय चर्चा यहाँ है: https://news.ycombinator.com/item?id=48238896
    लेख में कहा गया है, “The Verge ने रिपोर्ट किया कि Microsoft ने Claude Code की डायरेक्ट लाइसेंसिंग का अधिकांश हिस्सा रद्द करना शुरू कर दिया है”

    • यह लेख काफ़ी ढीले ढंग से लिखा गया लगता है
      1. कहीं भी ऐसा उद्धरण नहीं है कि Microsoft ने AI कर्मचारियों से ज़्यादा महंगा है कहा हो
      2. Nvidia की deep learning टीम कर्मचारियों की तुलना में AI पर ज़्यादा खर्च करती है, लेकिन उस टीम का उद्देश्य agentic coding नहीं बल्कि गहरा और भारी AI उपयोग है, इसलिए यह समझ में आता है
        “token-based pricing में आप जितना ज़्यादा इस्तेमाल करते हैं और efficiency जितनी बेहतर होती है, यह उतना महंगा हो जाता है” वाला हिस्सा भी अजीब है। समझ नहीं आता कि efficiency बेहतर होने पर लागत क्यों बढ़ेगी
  • शीर्षक भ्रामक लगता है, और लेख पढ़ने पर वजह और साफ़ हो जाती है। इन कंपनियों में जितने हो सकें उतने tokens जलाओ जैसे बेतुके OKR और लक्ष्य हैं
    अगर token usage को metric बना दिया जाए, तो नतीजा स्वाभाविक रूप से बहुत महंगा होगा
    inference cost अपने आप में संभालने लायक है, और इस तकनीक को उपयोगी बनाने के लिए ज़रूरी नहीं कि सबसे नया proprietary model ही चाहिए। मानव engineers काफ़ी समय तक और ज़रूरी रहेंगे, लेकिन मैं इससे सहमत नहीं हूँ कि “कुछ इंसान + LLM” सिर्फ़ और इंसान भर्ती करने से ज़्यादा महंगा होगा, या लगातार ज़्यादा महंगा ही बना रहेगा

    • इसे बस ऐसे भी कहा जा सकता था: कंपनी ने IT विभाग में प्रति developer प्रति दिन $1000 से ज़्यादा खर्च करने का OKR लागू किया। कंपनी IT लागत के पहले से कहीं ज़्यादा हो जाने पर हैरान हुई। फिर यह पता लगाने के लिए सिस्टम बनाने की बात कहकर कि ऐसा क्यों हुआ, इसे बढ़ाकर प्रति developer प्रति दिन $1500 कर दिया
      अभी vibe coding से ज़्यादा vibe leadership समस्या लगती है, और vibe leadership का AI से मूल रूप से कोई लेना-देना नहीं है। ऐसे लोग जो एक अस्पष्ट gut feeling पकड़ लेते हैं और फिर लागत या नतीजों की परवाह किए बिना उसे अलौकिक निष्कर्षों तक धकेलते रहते हैं
    • सिर्फ़ लेख को देखें तो ऐसा लगता है कि “AI” छोड़ा नहीं गया, बल्कि LLM को Claude Code से GitHub Copilot में बदला गया है
    • Goodhart's law: जब कोई metric लक्ष्य बन जाता है, तो वह अच्छा metric नहीं रह जाता
    • लगता है निवेशकों को उत्साहित करने वाले revenue numbers भी इसी token-as-metric दुनिया पर आधारित हैं। कोई business एक साथ विस्फोटक वृद्धि वाला भी हो और साथ ही उससे ROI निकालने के लिए बहुत सख़्त spending discipline भी चाहिए हो, ऐसा दोनों नहीं हो सकता
    • लगता है मीडिया ने AI को जलाने की कसम खा ली है। news feed में बस data center की बुराइयाँ, AI की बेकारियत, और हर कोई AI से नफ़रत करता है जैसी ख़बरें भरी हैं
  • इस लेख का आधार ही ग़लत है। Microsoft ने अंदरूनी Claude Code उपयोग इसलिए रद्द नहीं किया कि AI की लागत बहुत ज़्यादा है, बल्कि इसलिए कि उसके पास प्रतिस्पर्धी उत्पाद GitHub Copilot है और वह चाहता है कि कर्मचारी उसका अपना उत्पाद इस्तेमाल करें
    lockdown के दौरान Teams को इतनी तवज्जो मिलने की वजह भी यही थी

    • सही है। लेख ने Microsoft की कार्रवाई को लागत समस्या के साथ मिला दिया, जबकि असल में मामला लागत का नहीं है। फिर उसमें “Nvidia applied deep learning के VP” का एक मनमाना उद्धरण जोड़ दिया गया, जिसमें वह कहते हैं कि उनकी टीम में computing cost labor cost से ज़्यादा है
      लेकिन वह टीम software development के लिए LLM इस्तेमाल नहीं करती, वह सचमुच deep learning टीम है, और deep learning development style में computing जलाने वाली टीम है
      थोड़ा सा हिसाब लगाने पर भी दिख जाता है कि Microsoft AI पर developers से ज़्यादा पैसा नहीं दे सकता। product development भूमिकाओं में लगभग 80,000 कर्मचारी हैं, और senior developers की कुल लागत शायद लगभग $400,000 होगी
      क्या Microsoft के पास $32 billion का Claude bill है? शायद नहीं
    • दोनों बातें सही हो सकती हैं। Claude बहुत महंगा भी हो सकता है, और साथ ही वे कर्मचारियों को Copilot पर ले जाना भी चाहते हों। अपना उत्पाद होने के कारण लागत घटेगी, और उससे usage व feedback बढ़ने की उम्मीद भी की जा सकती है
      हाँ, lockdown के समय Teams को ध्यान मिलने वाला उदाहरण पहले दावे के समानांतर कैसे है, यह पूरी तरह स्पष्ट नहीं है
  • लेख में कहीं भी यह नहीं कहा गया कि Microsoft ने रिपोर्ट किया कि AI मानव कर्मचारियों से ज़्यादा महंगा है

    • वाह… Fortune को क्या हो गया? मैं इसे ऐसे clickbait से कहीं बेहतर outlet मानता था
    • हो सकता है पोस्ट के शीर्षक में एक शब्द छूट गया हो। शायद यह “Microsoft reports show AI is more expensive…” होना चाहिए था
      भले ही Microsoft ने इसे स्पष्ट रूप से न कहा हो, लेकिन यह बात फिर भी सामने आती है कि AI ज़्यादा महंगा है
  • tokenmaxxing ट्रेंड शायद इस AI लहर से निकला सबसे मूर्खतापूर्ण विचारों में से एक है। यह efficiency और productivity को अधिकतम करने के बिल्कुल उलट जाता है, फिर भी व्यापक रूप से स्वीकार किया जा रहा है

  • http://archive.today/l3EEo

  • Microsoft ने Claude को इसलिए रद्द किया क्योंकि Copilot उतना अच्छा नहीं है, इसलिए Copilot को ज़बरदस्ती इस्तेमाल कराया जाना है। यह अंदर की बात के तौर पर स्वीकार किया जा चुका है, कोई रहस्य नहीं है
    अभी Anthropic tokens पर subsidy थी, इसलिए Microsoft के नज़रिए से यह उल्टा और महंगा भी हो गया होगा

  • AI उपयोग की लागत का विश्लेषण करने के लिए उसके उपयोग के संदर्भ को देखना चाहिए
    बहुत से लोग AI का इस्तेमाल documents, Slack बातचीत, और emails को सजाने-सँवारने के लिए, या छोटे prompts से बेवजह बड़े documents बनवाने के लिए कर रहे हैं। कंपनी के भीतर Slack message या email भेजने के लिए AI की ज़रूरत होने की कोई वजह नहीं थी। यह resources और समय बर्बाद करना है, सिर्फ़ चीज़ों को ज़्यादा polished दिखाने के लिए, बिना अर्थ में कोई बड़ा बदलाव किए

    • ऐसे उपयोग में लागत काफ़ी कम होती है
  • tokens जलाना उतना ही आसान है जितना पैसे को भट्ठी में फेंकना
    token usage productivity का अच्छा metric नहीं है। समस्या यह है कि productive AI usage को कैसे मापा जाए, यह अभी तक किसी ने ठीक से नहीं समझा है। यह अलग करना मुश्किल है कि developers productivity maximize कर रहे हैं, सिर्फ़ tokens जला रहे हैं, या बदलाव का विरोध कर रहे हैं

    • यह नया lines of code metric है
  • AI मानव कर्मचारियों को वेतन देने से महंगा नहीं है। अभी AI मानव कर्मचारियों की जगह ले ही नहीं सकता, इसलिए शीर्षक का आधार ही ग़लत है