AI सब्सक्रिप्शन एंटरप्राइज़ के लिए टाइम बम है

(thestateofbrand.com)

7 पॉइंट द्वारा GN⁺ 2026-05-18 | 7 टिप्पणियां | WhatsApp पर शेयर करें

OpenAI, Anthropic, Google आदि कंपनियों को वास्तविक डिलीवरी कॉस्ट से कम सब्सक्रिप्शन कीमत दे रहे हैं, जिससे कीमत समायोजन के समय बड़ा कॉस्ट शॉक आ सकता है
Claude Pro और ChatGPT Plus का मासिक $20 फ्लैट प्लान, भारी उपयोग करने वालों के लिए API के हिसाब से प्रति सीट मासिक $200~400 तक की वास्तविक लागत बना सकता है
एजेंट-आधारित AI लंबे समय तक स्वायत्त रूप से चलकर टोकन खपत को बहुत बढ़ाता है, और GitHub Copilot भी जून 2026 से usage-based billing पर जा रहा है
50 लोगों की टीम का मासिक $1,000 सब्सक्रिप्शन खर्च, वास्तविक टोकन उपयोग के आधार पर मासिक $15,000~40,000 तक पहुंच सकता है, जिससे बजट जोखिम बढ़ता है
OpenAI और Anthropic की IPO तैयारी margin और unit economics के दबाव को बढ़ा रही है, जिससे price hike, usage limits, और consumption-based billing की ओर बदलाव तेज हो सकता है

AI सब्सक्रिप्शन प्राइसिंग और वास्तविक लागत के बीच अंतर

OpenAI, Anthropic, Google जैसे प्रमुख AI प्रदाता एंटरप्राइज़ ग्राहकों को वास्तविक डिलीवरी कॉस्ट से कम सब्सक्रिप्शन कीमत पर सेवाएं दे रहे हैं। अगर कंपनियां इस कीमत को स्थायी मानकर अपने workflows बना लेती हैं, तो भविष्य में कीमत बदलने पर उन्हें बड़ा कॉस्ट शॉक लग सकता है
Claude Pro मासिक $20 में Sonnet 4.6, Opus 4.6, web search, code execution, file generation, और free tier की तुलना में लगभग 5 गुना usage देता है
API के हिसाब से Sonnet 4.6 की कीमत input के लिए प्रति 1 million tokens $3 और output के लिए प्रति 1 million tokens $15 है, जबकि Opus 4.6 की कीमत input के लिए प्रति 1 million tokens $5 और output के लिए प्रति 1 million tokens $25 है
अगर knowledge workers रोज़ कई घंटे Claude का उपयोग करें और document upload, report writing, तथा data analysis जैसे काम करें, तो वे हर हफ्ते millions of tokens इस्तेमाल कर सकते हैं। API pricing में बदलने पर यह प्रति सीट मासिक $200~400 तक पहुंच सकता है
रिपोर्ट के अनुसार Microsoft को GitHub Copilot में प्रति user मासिक $20 से अधिक का नुकसान हुआ, और heavy users के मासिक $10 सब्सक्रिप्शन की compute cost $80 तक चली गई
एक विश्लेषण में यह भी कहा गया कि Anthropic के users ने subscription revenue के हर $1 पर $8 से अधिक की compute खपत की। OpenAI के product VP Nick Turley ने subscription pricing को एक संयोग से बनी संरचना बताया और unlimited plans को धीरे-धीरे खत्म करने की संभावना की तुलना बिजली के unlimited usage से की
ChatGPT Plus ने 3 साल तक मासिक $20 कीमत बनाए रखी, लेकिन इस दौरान image generation, code interpretation, voice mode, agent-style reasoning, और web search जैसी सुविधाएं लगातार बढ़ी हैं

प्रमुख प्रदाताओं की साझा प्राइसिंग रणनीति

Google, Gemini Advanced को मासिक $20 वाले Google One AI Premium बंडल में देता है, जबकि उसी model की API access के लिए अलग शुल्क लेता है
Meta, Llama को मुफ्त देता है और अपने platform पर होने वाली करोड़ों AI queries की compute cost को ad revenue से subsidize करता है
xAI का Grok, API input pricing को प्रति 1 million tokens $0.20 तक कम रखता है, और इसे market share हासिल करने के लिए नुकसान सहने वाली संरचना के रूप में देखा जाता है
साझा पैटर्न यह है कि कीमतें economics से ज्यादा adoption बढ़ाने के लिए तय की जाती हैं, organizations को lock-in किया जाता है, AI को हर टीम के रोज़मर्रा के काम में एक core dependency बनाया जाता है, और cost issue को बाद के लिए टाल दिया जाता है
OpenAI को consumer subscriptions पर नुकसान हो रहा है, और रिपोर्ट के मुताबिक वह enterprise segment पर अधिक ध्यान देने वाली strategy shift पर विचार कर रहा है, जहां unit economics अपेक्षाकृत कम खराब हैं
The Wall Street Journal के अनुसार, IPO की ओर बढ़ते हुए OpenAI अपने प्रमुख revenue और user targets से चूक गया, और subsidy-based pricing model में भी दरारें दिखने लगी हैं

एजेंट-आधारित AI लागत संरचना को और खराब करता है

chatbot usage में सवाल-जवाब से token consumption अपेक्षाकृत अनुमानित रहता था, लेकिन एजेंट-आधारित AI लंबे समय तक autonomous execution के कारण token usage को बहुत बढ़ा देता है
Claude Code sessions लंबे समय तक स्वायत्त रूप से चलते हैं और conversational usage की तुलना में कहीं तेज़ी से tokens खर्च करते हैं
कुछ users ने बताया कि उन्होंने 5 घंटे की rate limit window को 90 मिनट में खत्म कर दिया
GitHub ने घोषणा की कि flat-rate model agent-style workloads में काम नहीं कर रहा, इसलिए Copilot को 1 जून 2026 से usage-based billing पर ले जाया जाएगा
GitHub ने कहा कि Copilot काफी विकसित हो चुका है और agent-style usage "default बनता जा रहा है", जिससे compute और inference demand बढ़ती है
Sam Altman ने सार्वजनिक रूप से कहा कि OpenAI को अब AI inference company बनना चाहिए, जो इस बात से मेल खाता है कि agent-style usage के लिए मूल रूप से अलग economic model चाहिए
engineering teams में एक project पर parallel में काम करने वाले कई AI instances यानी Agent Teams लागत को बहुत बढ़ा सकते हैं। अगर कोई developer एक साथ 3~4 coding agents चलाता है, तो token usage साधारण chat की तुलना में सिर्फ कुछ गुना नहीं बल्कि single-digit multiples से भी अधिक बढ़ सकता है

वह कॉस्ट एक्सपोज़र जिसे कंपनियां माप नहीं रहीं

पिछले 2 वर्षों में कई कंपनियों ने AI subscriptions को operations के भीतर गहराई से शामिल कर लिया है। marketing, ChatGPT Plus से copy लिख रही है; engineering, Claude Pro से code writing और review कर रही है; और research, customer success, finance teams भी document summary, ticket summary, और scenario modeling के लिए AI का उपयोग कर रही हैं
अगर 50 लोग Claude Pro इस्तेमाल करते हैं, तो मौजूदा खर्च मासिक $1,000 है। ChatGPT Plus भी लगभग इसी स्तर पर है, इसलिए P&L में AI एक छोटा-सा line item लग सकता है
लेकिन उसी टीम के वास्तविक API usage को token consumption के आधार पर देखें, तो usage intensity के अनुसार यह मासिक $15,000~40,000 तक हो सकता है, यानी यह अलग budget code मांगने वाला खर्च बन जाता है
जब कीमतें बदली जाएंगी, तब वे कंपनियां जिन्होंने $20 प्रति माह वाले AI को स्थायी रूप से सस्ता input माना था, अपने workflows में इसे गहराई से शामिल कर चुकने के बाद ऐसे bill का सामना करेंगी जिसे हटाना या टालना मुश्किल होगा
subsidy dependency बनाती है, और dependency कंपनियों को price hikes से बच निकलने में मुश्किल स्थिति में डाल देती है
KPMG की Q1 2026 AI Quarterly Pulse के अनुसार, अमेरिकी organizations अगले 12 महीनों में औसतन $207 million AI spending की उम्मीद कर रहे हैं, जो पिछले साल की समान अवधि की तुलना में लगभग दोगुना है
Goldman Sachs research survey के मुताबिक, कई बड़े enterprises पहले ही अपने AI budgets को कई अंकों से पार कर चुके हैं, और निकट भविष्य में AI spending engineering salaries के बराबर पहुंच सकती है
KPMG North America में AI और data labs के प्रमुख Swami Chandrasekaran ने Marketplace से कहा कि सिर्फ एक-दो quarters पहले तक कोई भी LLM consumption cost पर ध्यान नहीं दे रहा था
University of Chicago के economist Brian Jabarian, जो enterprise AI transitions पर सलाह देते हैं, कहते हैं कि bill आने का समय नज़दीक है

IPO प्राइस रीसेट को मजबूर कर सकता है

OpenAI और Anthropic IPO की तैयारी कर रहे हैं, और इस प्रक्रिया में subscription pricing और वास्तविक लागत के बीच अंतर कम करने का दबाव बढ़ सकता है
रिपोर्ट के अनुसार Anthropic का annualized revenue 30 billion dollars से ऊपर पहुंच चुका है, जो 2025 के अंत के $9 billion से बढ़ा है
OpenAI को लगभग $25 billion revenue run rate पर बताया जा रहा है
कहा गया है कि OpenAI 2029 तक cumulative cash burn $115 billion का अनुमान कर रहा है, और 2030 तक compute spending $665 billion तक commit कर चुका है
Oracle ने OpenAI के लिए data centers बनाने हेतु एक fiscal year में 43 billion dollars का debt लिया बताया गया है
जब तक private company के रूप में venture capital जलाया जा सकता है, तब तक inference cost को subsidize करना, loss पर models चलाना, और मासिक $20 का ऐसा plan बनाए रखना जिसकी delivery cost $100 से अधिक हो, संभव है
IPO के बाद public markets margin मांगेंगे, analysts unit economics पर सवाल करेंगे, और investors ऐसी profitability path चाहेंगे जो असीमित fund-raising पर निर्भर न हो
प्राइस गैप को जल्दी बंद करने के सबसे सीधे तरीके हैं price hikes, usage limits, और consumption-based billing, और ये तीनों मौजूदा enterprise subscribers पर बड़ा असर डाल सकते हैं

प्राइस रीसेट के संकेत पहले से दिख रहे हैं

GitHub 1 जून 2026 से usage-based billing पर जा रहा है, और flat-rate premium requests को token-based AI Credits से बदल रहा है
Microsoft ने 4 साल में Microsoft 365 की कीमतें दो बार बढ़ाईं, और हाल की वृद्धि सीधे AI infrastructure cost से जुड़ी है
OpenAI ने heavy users के लिए नई वास्तविक pricing को दिखाते हुए $100 Pro tier शुरू किया है
Anthropic का मासिक $200 Max tier इस बात का उदाहरण है कि subsidy खत्म होने पर निश्चित usage की वास्तविक लागत कितनी हो सकती है
Conga के VP Geoff Webb ने कहा कि AI market capture race का पैमाना बहुत बड़ा है, और इसे नियंत्रित करने की लागत भी उतनी ही बड़ी है। इसलिए service monetization और investment recovery की प्रक्रिया में business models और service pricing में तेज़ व बड़े बदलाव आ सकते हैं

कंपनियों के नेताओं को अभी क्या करना चाहिए

कंपनियों को सिर्फ seats गिनने के बजाय हर team की वास्तविक token consumption का audit करना चाहिए
मौजूदा pricing के मुकाबले 2x, 5x, 10x cost scenarios में AI खर्च कैसे बदलेगा, इसका modeling करना चाहिए
stack के भीतर vendor optionality बनानी चाहिए ताकि किसी एक provider की pricing change अचानक बजट न बिगाड़ दे
CFO के पहले मुद्दा उठाने से पहले, AI cost gap पर CFO से बात करनी चाहिए
आज organization AI पर जितना भुगतान कर रही है और 18 महीने बाद जितना कर सकती है, उनके बीच का अंतर कई कंपनियों के लिए absorb करने वाले सबसे बड़े cost increases में से एक हो सकता है
ऐसी स्थिति आ सकती है जहां पहले team lunch से भी सस्ता लगने वाला tool अचानक सालाना six-figure budget मांगने लगे, और कंपनियों को इसका जवाब देना पड़े
subsidy का दौर खत्म हो रहा है, लेकिन कई कंपनियों ने अभी तक इस चर्चा की शुरुआत भी नहीं की है

7 टिप्पणियां

hmmhmmhm 2026-05-18

लगता है यह वही मुद्दा है जो mainframe के समय था..
अगर ऐसी स्थिति बनती है कि server महंगे हैं और resources की कमी है, और personal computers धीमे हैं,
तो आखिरकार server भी सस्ते होंगे और personal computers की performance भी बढ़ेगी... लगता है समय ही इसका जवाब है।

GN⁺ 2026-05-18

Hacker News की राय

सभी AI subscriptions frontier model providers के लिए एक time bomb जैसे हैं
कुछ सालों में हम आज के frontier models जितने अच्छे local models को लगभग बिना लागत के चला पाएँगे, और frontier कंपनियों का enterprise market base ढह जाएगा
- “कुछ सालों में आज के frontier models जितने अच्छे local models चलेंगे” — इसका आधार क्या है, समझ नहीं आता
  सिर्फ memory requirements ही बहुत बड़ी हैं, और कुछ समय तक shared dedicated hosting hardware को high utilization पर चलाना ही कहीं ज़्यादा cost-efficient रहेगा
- दूसरे शब्दों में, frontier models ऐसी assets हैं जिनकी value market competition की वजह से बहुत तेज़ी से गिरती है
  उन्हें एक-दूसरे और open-weight models से आगे रहने के लिए लगातार बेहतर होना पड़ता है, इसलिए यह time bomb के उलट ज़्यादा लगता है
  मौजूदा स्तर के inference tokens लगातार सस्ते होते जाएँगे, और local final state होगा या नहीं यह hardware requirements ऊँची होने की वजह से कहना मुश्किल है, लेकिन competition का रुझान margins को 0 के करीब धकेलने का होता है
  इस विषय पर लंबी चर्चा: https://corecursive.com/the-pre-training-wall-and-the-treadm...
- पिछले एक महीने में मैंने Qwen, Gemma, Deepseek को LiteLLM के पीछे जोड़कर एक छोटा demo बनाया है जो दिखाता है कि भविष्य कैसा हो सकता है
  मैं token usage monitor कर रहा हूँ, और बेवजह बहुत tokens खर्च करने के बजाय inference cost घटाने और उसे in-house लाने की दिशा में सक्रिय रूप से बढ़ रहा हूँ
  मेरा boss बहुत खुश था, और अब इसे और व्यापक रूप से deploy किया जा रहा है। मुझे यही भविष्य लगता है
- यह दावा कि कुछ सालों में हम आज के frontier models जितने अच्छे local models चलाएँगे, बहुत संदिग्ध है
  scaling laws भी पहले ही भारी पड़ने लगे हैं, और “exponential” जैसी बढ़ा-चढ़ाकर कही जाने वाली बातों में नहीं बहना चाहिए
  और असली competitor तो 2 साल बाद के frontier models हैं
- अगर hardware production या model architecture में कोई बड़ा breakthrough नहीं आता, तो उलटा सच है
  1~2 साल पहले की तुलना में अब hardware बड़ा, महँगा और ज़्यादा energy-consuming चाहिए
AI के दोनों पक्षों की लिखाइयों का बढ़ा-चढ़ा tone बहुत थका देने वाला है
मैं economy और token provider business को अच्छी तरह समझने वाले किसी व्यक्ति से whiteboard के सामने “जैसे पाँच साल के बच्चे को समझाते हैं” वैसे पूछना चाहता हूँ
क्या token providers के लिए यह margin game है और consumers के लिए service/product quality game, और अगर quality और margin की रेखाएँ किसी बिंदु पर एक-दूसरे को काटती हैं, तो क्या यह उस बिंदु तक पैसे खत्म होने से पहले पहुँचने की race है? अगर हाँ, तो क्या इतिहास में ऐसे उदाहरण हैं जहाँ दोनों के बीच का अंतर बहुत बड़ा था?
LLMs इस मायने में अलग लगते हैं कि consumer कितना बेहतर होने की उम्मीद करता है, इसकी practically कोई सीमा नहीं दिखती, और यह email जैसी ऐसी service नहीं है जो compute resource के नज़रिये से आसानी से scale हो जाए
यह बहुत शुरुआती सवाल है, लेकिन sustainable business model बनने से पहले IPO क्यों करना चाहते हैं, यह भी जानना चाहता हूँ। इसका फायदा क्या है?
- जब मैंने AI से Opus tokens की production cost पूछी, तो उसने hardware, power, cooling और hosting सहित 1 million tokens पर 0.216 डॉलर बताया
  यहाँ दिए गए links के मुताबिक Anthropic के खर्च का लगभग 30% inference पर जाता है, और बाकी 70% R&D पर, जैसे अगला model develop करना
  इसे ध्यान में रखकर और profit जोड़कर अगर आँकड़े सरल करें, तो पैसा कमाने के लिए 1 million tokens को लगभग 1 डॉलर में बेचना काफी होगा
  अभी API price 1 million tokens पर 25 डॉलर है, इसलिए इसके profitable होने पर मुझे कोई संदेह नहीं है
  दूसरी ओर, अगर कोई monthly 200 डॉलर वाले Max plan का बहुत extreme इस्तेमाल करे, तो वह महीने में 10 billion tokens तक चला सकता है, जो 1 million tokens पर 0.02 डॉलर बैठता है, यानी बहुत बड़ा नुकसान उठाना पड़ता है, और यह कभी न कभी खत्म होगा
  लेकिन अगर कोई monthly 100 डॉलर वाले Anthropic plan पर महीने में 100 million tokens इस्तेमाल कर रहा है, तो कंपनी पैसा कमा रही है
  महीने में 10 billion tokens इस्तेमाल करने के लिए बहुत लंबा काम करना होगा और AI इस्तेमाल करने में सचमुच बहुत कुशल होना पड़ेगा; ऐसे लोग वैसे भी कई सालों से AI इस्तेमाल कर रहे होंगे और Opus से पहले भी इसे उपयोगी पाते रहे होंगे
  Opus खोने पर वे निराश होंगे, लेकिन वही उपयोगकर्ता ऐसे होते हैं जो कमज़ोर models को भी अच्छी तरह इस्तेमाल कर सकते हैं, इसलिए कुछ साल बाद वे in-house hosted open source models पर चले जाएँ, तब भी आज जैसी 1 million tokens पर 0.02 डॉलर वाली लागत पा सकते हैं
  इसलिए मैं इस लेख के निराशावादी माहौल से सहमत नहीं हूँ। स्थिति बदलेगी, लेकिन इसका मतलब AI उपयोग का अंत नहीं है
मैं लेख की भावना से सहमत हूँ, लेकिन इसकी writing बहुत LLM-जैसी लगती है
खासकर section structure और “That is not a rounding error. That is a line item that needs its own budget code.” जैसी punchlines
- Claude सचमुच ऐसी पंक्तियाँ बहुत बनाता है
  काफ़ी irritate करने वाला है, और वही prompt Gemini पर देने पर ऐसा कम दिखता है
- पता नहीं यह लेख मूल रूप से किसने लिखा है
  लेख में author name नहीं है
- Pangram ने इस लेख को बहुत high confidence के साथ 100% AI-generated बताया है
Brad Gerstner ने पुष्टि की है कि tokens नुकसान में नहीं बेचे जा रहे
formula API और subscription के बीच कैसे बाँटे जाएँ, इससे अलग, कंपनियाँ शुद्ध token sales के आधार पर profit में हैं
salaries और stock compensation जोड़ने पर नुकसान हो सकता है, लेकिन token खुद अभी profitable हैं
- यह ऐसा है जैसे धरती के सबसे ताकतवर engine लगे rocket को orbit के बाहर जाते देखने के बाद engine बंद कर कहना कि “यह अब बिना power के उड़ रहा है”
  अभी ऐसा हो सकता है, लेकिन यहाँ तक पहुँचने का तरीका वह नहीं था
  recover की जाने वाली investment trillions of dollars की है, जबकि revenue ज़्यादा से ज़्यादा tens of billions है, इसलिए यह हिसाब कि tokens जल्दी profit देंगे, सही नहीं लगता
- Tokens को profit margin के साथ बेचा जा सकता है, लेकिन compute spending का 70% R&D और model training में जाता है[0]
  inference सिर्फ अपने आप profitable होने भर से काम नहीं चलेगा; उसे वह लागत भी उठानी होगी
  [0] https://epoch.ai/data-insights/openai-compute-spend
- नुकसान में नहीं बेच रहे, लेकिन इतना महँगा भी नहीं बेच रहे कि मौजूदा losses और costs cover हो जाएँ
  यह नुकसान एक अजीब circular financing structure के भीतर घुमाया जा रहा है, और कभी न कभी debt crisis में टूट सकता है
- दूसरे शब्दों में, AI कंपनियों का pre-cost profit positive है
- Claude Code या Codex tokens पर भी यही लागू होता है या नहीं, पता नहीं
  मुझे लगता है वहाँ भारी subsidy है, लेकिन मुझे असली value सिर्फ उन्हीं में महसूस होती है
पूरी “AI” समस्या की बात करें तो, उसके बिना भी जीना आसान है
AI कंपनियाँ यह जानती हैं, users जानते हैं, और सबसे AI-agent-friendly managers भी जानते हैं
अगर अभी इसी क्षण पूरी दुनिया से AI हटा दिया जाए, तो नतीजा बस वही रोज़मर्रा का काम होगा
यह लेख इस बात पर पर्याप्त ज़ोर नहीं देता। क्या बात बस इतनी है कि PR review फिर से असली engineers को देना पड़ेगा, और यही डरावना लग रहा है?
- नई technology अपनाने के शुरुआती दौर में हमेशा ऐसा ही नहीं होता क्या?
  technology जितनी गहराई से integrate होती जाती है, यह उतना ही कम सच रह जाता है
  electric motor आने के कुछ साल बाद भी यही कहा जा सकता था, और बस steam पर वापस चला जा सकता था
  लेकिन आज electric motor के बिना जीने की कोशिश करो तो समाज ढह जाएगा
  सवाल यह नहीं कि अभी उसके बिना काम चल सकता है या नहीं, बल्कि यह है कि पूरी तरह integrate हो जाने के बाद 5~10 साल में भी क्या उसके बिना काम चल सकेगा
- शायद इसी वजह से इसे और आक्रामक तरीके से push किया जा रहा है
  ईमानदार revenue बनाने के लिए नहीं, बल्कि AI products को इतना गहराई से ठूँस देने के लिए कि “चलो AI हटा दें” कोई विकल्प ही न लगे
  भले maintenance cost लगातार बढ़कर airline-style government bailout के स्तर से भी ऊपर चली जाए
  यह झूठे वादों पर बिकने वाली एक नई wealth-extraction intermediary layer है
- जो लोग JavaScript इस्तेमाल करते हैं, उनके लिए तो यह स्वाभाविक ही होगा
  कम से कम JavaScript लिखने के लिए तो मैं AI के बिना नहीं रह सकता
- जब लोग बहुत साधारण और सामान्य कामों में भी AI tools इस्तेमाल करने की सलाह देते हैं, तो हमेशा अजीब लगता है
  जैसे उसे ऐसे treat किया जा रहा हो मानो वह कोई पालतू जानवर हो जो कभी-कभार इस्तेमाल न करो तो मर जाएगा
यह लेख गलत है। ऐसे subscriptions enterprises को दिए ही नहीं जाते, ऐसा नहीं है
कंपनियाँ API pricing के कहीं ज़्यादा करीब रकम चुकाती हैं
strategy यह है कि personal subscriptions में लोगों को unlimited tokens की आदत डालो, ताकि उम्मीद हो कि वही behavior workplace तक पहुँच जाए
- दिए जाते हैं
  team या enterprise seats consumer pricing से महँगी होती हैं, लेकिन fixed-price होती हैं जिनमें usage limits reset होती रहती हैं
  आप members को monthly 20/100/200 डॉलर plans के बराबर seats assign कर सकते हैं, और पूरी तरह metered billing भी कर सकते हैं
  खरीदने के कई तरीके हैं
- subscriptions enterprises को निश्चित रूप से दिए जाते हैं
  बराबर के consumer plans के अनुरूप metered plans भी हैं
- मुझे समझ नहीं आया कि enterprise subscriptions की बात क्यों हो रही है
  जिस कंपनी में मैं काम करता हूँ, वहाँ API usage के आधार पर bill होता है
- ऐसे paragraphs देखकर यह AI-generated text जैसा ज़्यादा लगता है
  “कुल मिलाकर pattern वही है। economics के लिए pricing नहीं, adoption के लिए pricing। organizations को lock-in करो। AI को हर team के रोज़मर्रा के काम का load-bearing हिस्सा बना दो। bill की चिंता बाद में करो.”
- इतना ही नहीं, लेख में जिस API bill scale पर घबराहट दिखाई गई है, वह अभी भी तुलनात्मक रूप से छोटा ही है
  monthly 10,000 डॉलर कोई मामूली रकम नहीं है, लेकिन अगर उससे 10~20 engineers की team support होती है, तो यह काफ़ी अच्छा leverage है
मैंने मूल लेख अंत तक नहीं पढ़ा, लेकिन पहचान गया कि वह AI ने लिखा है
शायद OpenRouter को AI provider cost basis के benchmark की तरह इस्तेमाल किया जा सकता है
मैं बार-बार सुनता हूँ कि यह Claude से बेहतर value देता है, तो शायद इसका मतलब है कि Anthropic किसी वजह से खास तौर पर inefficient है या inference पर profit कमा रहा है
training पर वे नुकसान कर सकते हैं, लेकिन वह शायद leading lab बने रहने की cost है
अगर कोई एक कंपनी debt वगैरह से गिर भी जाए, तो enterprises बस provider बदल नहीं लेंगे क्या?
“It’s not X. It’s Y.” जैसे वाक्यांश, या “load-bearing” को रूपक की तरह इस्तेमाल होते एक बार और देखूँ तो उल्टी आ जाएगी
- मैंने ऐसे expressions काफ़ी generate होते देखे हैं, और यह कोई छोटी list नहीं है
  “subsidy era शालीनता से खत्म नहीं हो रही। वह हर जगह दरारें दिखा रही है।”
  “सवाल यह नहीं कि deal अच्छी थी या नहीं। सवाल यह है कि वह कितने समय तक टिक सकती है।”
  “जो developer एक साथ तीन-चार coding agents चला रहा है, वह chat conversation की तुलना में 3x या 4x tokens नहीं जला रहा। वह single digits नहीं, बल्कि एक order of magnitude ज़्यादा जला रहा है।”
  “ये अब experiments नहीं रहे। ये load-bearing workflows हैं।”
  “वह rounding error नहीं है। वह ऐसा line item है जिसके लिए अलग budget code चाहिए।”
- अगर कोई बड़ा pricing adjustment आता है, तो free या monthly 20 डॉलर subscription से social media comments generate करने वाले बहुत से लोग असली लागत देखकर फिर से खुद लिखने लगेंगे
  कम से कम ऐसी उम्मीद तो की जा सकती है
- “the unlock” कहना भी उतना ही नापसंद है
- इस लेख की शुरुआत ठीक थी
  data था और logic भी काफ़ी plausible था, लेकिन जैसे ही बीच के आसपास पहुँचा, trend example, फिर एक और example, तीसरा example, और “वह सिर्फ X नहीं, बल्कि Y है” बाहर आ गया
  ऐसा irritate करने वाला जैसे कोई अच्छी लिखी चीज़ पढ़ रहे हों, source link पर click करें और rickroll हो जाए
Enterprise customers monthly 20 डॉलर वाला Claude Pro subscription इस्तेमाल नहीं कर रहे
हमारी कंपनी developers को monthly लगभग 1,000 डॉलर के usage limits देती है, और मेरी नज़र में API cost के मुकाबले saving ज़्यादा से ज़्यादा 30% है
यह कोई पागलपन वाली subsidy नहीं है
दूसरे roles में अक्सर monthly सिर्फ 50 डॉलर allowed होता है, और वे लोग भी लगातार limit तक पहुँच जाते हैं
GitHub Copilot business और enterprise seats में यह तरीका इस्तेमाल करता रहा है, लेकिन जल्द ही limit से टकराएगा
मुझे लगता है June के बाद consumer Pro और Pro+ accounts को realign करने पर यह तेज़ी से catch up करेगा
OpenAI token उड़ेलकर customers को lock-in करना चाहता लगता है, इसलिए IPO के बाद OpenAI की pricing/terms में अचानक बदलाव सबसे बड़ी चिंता लगते हैं
Anthropic इस मामले में पहले से ज़िम्मेदारी के साथ चल रहा है, और GitHub Copilot भी अगले कुछ महीनों में excessive subsidies को ठीक करने की कोशिश कर रहा है
- वास्तव में सिर्फ GitHub Copilot ने ही बेहिसाब subsidy दी थी
  क्योंकि वह token नहीं बल्कि “requests” के हिसाब से charge करता था
  3 cent की एक request token terms में 20 डॉलर से ज़्यादा जला सकती थी, और वह तरीका इस महीने खत्म हो रहा है
  मैं भी GHCP से बड़े chunks of work करवाता रहा हूँ इसलिए चिंतित था, लेकिन नए billing estimator को देखकर लगा कि API pricing के हिसाब से यह monthly 150~200 डॉलर के आसपास था
  यह monthly 20 डॉलर subscription पर subsidy तो है, लेकिन पागलपन की हद तक नहीं
  अगर आप agentic coding tools का ज़िम्मेदारी से, काफी मात्रा में उपयोग करें, तो API pricing पर लगभग monthly 200 डॉलर के आसपास बैठने की संभावना है
  अगर उस price point पर provider पैसा कमा सकता है, तो पश्चिमी देशों में developers hire करने वाली कंपनियों के लिए बचने वाले समय को देखते हुए इसे स्वीकार करना मुश्किल नहीं होगा
  असली जोखिम personal projects करने वाले vibe coders के लिए है
  subsidized plans का दुरुपयोग करके विशाल apps बनाने का दौर खत्म हो रहा है
अगर यह developers को replace करता है, तो monthly 20 डॉलर या 100 डॉलर से महँगा होना समझ में आता है
LLM कंपनियों की असली समस्या यह है कि coding के बाहर उन्होंने अभी तक value साबित नहीं की है
उसके बिना वे बस coding tools बनकर रह जाएँगी
इसलिए अभी इतनी जल्दी मची हुई है, और असली सवाल यह है कि कौन-सा workflow और automate किया जा सकता है
paperwork शायद पूरी तरह automate किया जा सके
जैसे-जैसे दूसरे areas विकसित होंगे, वे pricing model बदल देंगे
- Figma को replace करने की कोशिश भी कुछ हद तक हो रही है
  उसमें value हो सकती है

taekim34 2026-05-19

टोकन बचाने के लिए यह रीयल-टाइम में देखना ज़रूरी है कि "मैं अभी कितना इस्तेमाल कर रहा हूँ"। खासकर token-based billing, subscription fee से अलग, usage pattern के अनुसार non-linear तरीके से उछल सकती है, इसलिए session unit पर यह देख पाना ज़रूरी है कि लागत कहाँ लीक हो रही है ताकि समय पर कार्रवाई की जा सके। अगर आप Claude Code environment में हैं, तो cc-token-saver (https://github.com/ww-w-ai/cc-token-saver) एक बार आज़माइए। यह session-वार और interval-वार लागत रीयल-टाइम में दिखाता है, cache expire होने पर महंगे retransmission को अपने-आप रोकता है, और भारी कामों को कम-लागत वाले SubTask को अपने-आप delegate भी कर देता है।

iolothebard 2026-05-18

आख़िरकार इस्तेमाल करने लगते हैं।

iPhone 3 की कीमत 200~300 डॉलर थी… अब यह आसानी से 1000 डॉलर से ऊपर है, फिर भी इस्तेमाल कर रहे हैं। इसका स्वाद लग चुका है।

prunusnira 2026-05-18

लगता है कि local LLM बनाना धीरे-धीरे और ज़्यादा बढ़ेगा।

master6559 2026-05-18

महंगा है तो इस्तेमाल मत करो..

aer0700 2026-05-18

लगता है कि LLM provider यह सोचकर कीमतें बढ़ा रहे हैं कि लोग महंगा होने पर भी इस्तेमाल करेंगे। आगे GLM, qwen, deepseek जैसे open source LLM का क्या होगा, यह दिलचस्प है। लोग शायद हिसाब लगाना शुरू करेंगे कि क्या यह कीमत देकर frontier model इस्तेमाल करना चाहिए, या फिर खुद vLLM infrastructure लागू करने की मेहनत उठाकर open source इस्तेमाल करना बेहतर रहेगा।