मुझे लगता है कि Anthropic और OpenAI ने product-market fit पा लिया है

(simonwillison.net)

9 पॉइंट द्वारा GN⁺ 2026-05-28 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Anthropic और OpenAI के coding और general-purpose agents उपभोक्ता subscriptions की तुलना में enterprise usage-based billing में अधिक revenue potential दिखा रहे हैं
Claude Code और Codex के heavy users $200/माह subscription पर API दरों के हिसाब से $2,180.16 के tokens इस्तेमाल करते हैं, लेकिन enterprise ग्राहकों को ऐसा समान discount नहीं मिलता
अप्रैल 2026 में दोनों कंपनियों ने Codex और Claude Code/Cowork की Enterprise लागत को public API pricing के अनुरूप कर दिया और उससे भी महंगे frontier models लॉन्च किए
OpenAI की 703 job postings में 229 और Anthropic की 390 postings में 105 को enterprise sales/support प्रकृति का वर्गीकृत किया जा सकता है, जो direct sales shift को साफ दिखाता है
Uber और Microsoft के cost विवादों को AI की विफलता से अधिक ऐसे price fit संकेत के रूप में पढ़ा जा सकता है, जहां ग्राहक कीमत का भार महसूस करते हुए भी इसका उपयोग करते हैं

enterprise ग्राहक API कीमतें चुकाना शुरू कर रहे हैं

Anthropic का $100/माह Max plan और OpenAI का $100/माह Pro plan coding agent के heavy users के लिए बेहद फायदेमंद कीमत पर हैं
ccusage से पिछले 30 दिनों के उपयोग को API token pricing में बदलें तो Anthropic Claude Code का उपयोग $1,199.79 और OpenAI Codex का $980.37 बैठता है
- दोनों को मिलाकर $2,180.16 के tokens सिर्फ $200 में उपयोग किए गए
- यह अंतर सिर्फ पूरे दिन agent चलाने वाले स्तर पर नहीं, बल्कि “काफी ज्यादा इस्तेमाल करने वाले उपयोगकर्ता” के स्तर पर भी बड़ा है
यह मान लेना कि enterprise बड़े पैमाने पर agents इस्तेमाल करेंगे तो उन्हें भी ऐसा discount मिलेगा, सही नहीं निकला
लगता है कि Anthropic ने पिछले 6 महीनों में Enterprise plan को पहले वाले “सामान्य कार्यदिवस के लिए पर्याप्त उपयोग शामिल” ढांचे से बदलकर $20/माह प्रति seat + usage-based API billing कर दिया है
- अगस्त 2025 में “Claude seats include enough usage for a typical workday” कहा गया था
- The Information की रिपोर्ट 14 अप्रैल 2026 की है, लेकिन Anthropic के प्रवक्ता ने कहा कि pricing change नवंबर 2025 में किया गया था
- मौजूदा ग्राहकों को यह बदलाव contract renewal के समय पता चल रहा है
OpenAI ने भी अप्रैल 2026 में ऐसा ही pricing change लागू किया
- Codex rate card के अनुसार 2 अप्रैल 2026 से Codex pricing message-based नहीं, बल्कि API token usage के आधार पर तय की गई
- 2 अप्रैल का बदलाव नए और मौजूदा Plus, Pro, ChatGPT Business, और नए ChatGPT Enterprise plans पर लागू हुआ
- 23 अप्रैल को यह Edu, Health, Gov, ChatGPT for Teachers सहित सभी मौजूदा ChatGPT Enterprise plans पर भी लागू हुआ
- कीमतें “credits” में दिखाई जाती हैं, लेकिन वे model-specific API token लागत के अनुरूप लगती हैं
अप्रैल 2026 तक OpenAI Codex और Anthropic Claude Code/Cowork की Enterprise लागत public API pricing के बराबर हो गई
उसी महीने दोनों leading model कंपनियों ने और महंगे frontier models भी लॉन्च किए
- 23 अप्रैल को लॉन्च हुआ GPT-5.5, GPT-5.4 की तुलना में API pricing में 2x महंगा है
- 16 अप्रैल को लॉन्च हुआ Opus 4.7, नए tokenizer को ध्यान में रखने पर Opus 4.6 से लगभग 1.4x महंगा है
अप्रैल 2026 में एक साथ दो बदलाव दिखे: महंगे frontier models की लॉन्चिंग और enterprise ग्राहकों को पुराने बड़े discounts की बजाय API pricing से बांधना

यह निष्कर्ष कि product-market fit हासिल हो गया है

Anthropic और OpenAI की अचानक pricing push को IPO तैयारी से भी जोड़ा जा सकता है, लेकिन ज्यादा महत्वपूर्ण बात यह लगती है कि Claude Code/Cowork और Codex जैसे coding और general-purpose agent products ने product-market fit पा लिया है
ChatGPT ने जनप्रियता हासिल की, लेकिन उस लोकप्रियता को revenue में बदलना मुश्किल रहा
- OpenAI ने फरवरी में कहा कि ChatGPT के weekly active users 90 करोड़ से अधिक हैं
- paid consumer subscribers 5 करोड़ थे, यानी कुल का 5.6%
प्रति user $10–$20/माह charging एक ठीक business है, लेकिन $1 trillion infrastructure लागत उठाने के लिए 1–2 billion subscribers को 4 साल तक बनाए रखना होगा
यदि enterprise प्रति user $200/माह या उससे अधिक खर्च करते हैं, तो यह कहीं तेजी से बड़े revenue में बदल सकता है
- power users के स्तर पर पहले ही प्रति vendor लगभग $1,000/माह के API cost के बराबर usage हो रहा है
coding agents बहुत अधिक tokens खर्च करते हैं, लेकिन वे उच्च वेतन वाले professionals के रोजमर्रा के tools बनते जा रहे हैं
- अभी इसका केंद्र मुख्यतः software engineers हैं
- कंप्यूटर पर command देकर किए जा सकने वाले कामों को automate किया जा सकता है, इसलिए यह व्यापक skilled knowledge workers तक भी लागू हो सकता है
नवंबर 2025 में लॉन्च हुए models ने agents को वास्तव में उपयोगी स्तर तक पहुंचाया, और उसके बाद 6 महीनों में enterprises ने इस तकनीक को अपनाते हुए वास्तविक खर्च बढ़ाना शुरू किया
ChatGPT को फरवरी 2023 में इतिहास का सबसे तेजी से बढ़ने वाला consumer app बनकर product-market fit हासिल हुआ माना जा सकता है, लेकिन उस समय यह ठोस revenue नहीं बना पाया
coding agents और enterprise pricing policy का मेल उस बिंदु जैसा दिखता है जहां इन कंपनियों ने बहुत वास्तविक revenue बनाना शुरू किया

hiring expansion से दिखता enterprise focus

OpenAI और Anthropic की public job postings में भी संकेत मिलता है कि enterprise agents ने product-market fit हासिल कर लिया है
OpenAI के पास अभी 703 job postings हैं, जिनमें 229 यानी 32.6% enterprise sales/support से जुड़ी दिखती हैं
- इनमें account executives, “Go To Market”, “Forward Deployed Engineers” आदि शामिल हैं
Anthropic के पास 390 job postings हैं, जिनमें 105 यानी 26.9% enterprise प्रकृति की लगती हैं
यह विडंबनापूर्ण है कि AI labs ने मानव श्रम-प्रधान enterprise sales model चुना है
- enterprise sales contracts को पूरा करने में बहुत लोगों की भागीदारी लगती है
hiring analysis Claude Code से job sites scrape करके, Datasette की JSON API, Datasette Cloud, और Datasette Agent के माध्यम से किया गया, और परिणाम gist में प्रकाशित हैं

AI failure stories की तरह पेश किए जाने वाले cost विवादों का आधार कमजोर है

बड़ी कंपनियां AI usage cost बढ़ने पर अलार्म बजा रही हैं, ऐसी कहानियां बढ़ी हैं, लेकिन जिन उदाहरणों को सबसे ज्यादा उद्धृत किया जाता है वे बढ़ा-चढ़ाकर पेश किए गए लगते हैं
Uber मामला
- सबसे ज्यादा चर्चा वाला उदाहरण वह The Information रिपोर्ट है जिसमें Uber CTO Praveen Neppalli Naga ने कहा कि Uber ने “2026 के कुछ ही महीनों में अपना पूरा वार्षिक AI budget खर्च कर दिया”
- बढ़ी हुई लागत का बड़ा हिस्सा Claude Code से जोड़ा गया
- चूंकि Claude Code वास्तव में नवंबर 2025 में काफी बेहतर हुआ, इसलिए 2025 में बनाया गया budget 2026 की मांग नहीं भांप पाया, यह हैरानी की बात नहीं है
- Uber COO Andrew Macdonald की Rapid Response podcast टिप्पणी ने भी विवाद बढ़ाया, लेकिन संबंधित अंश की सामग्री सीमित है
- Andrew Macdonald ने कहा कि पिछले quarter के code commits में 25% Claude Code के जरिए हुए, लेकिन उस productivity gain को यह साबित करना मुश्किल है कि उससे रुके हुए projects फिर शुरू हुए या उपभोक्ताओं के लिए 25% ज्यादा उपयोगी features बन पाए
- इस टिप्पणी से Business Insider के “AI tokenmaxxing spend को justify करना कठिन होता जा रहा है” जैसे headlines बने
Microsoft मामला
- दूसरा लोकप्रिय उदाहरण यह है कि Microsoft ने Claude Code licenses रद्द करना शुरू किया
- ऊपर से देखने पर यह कदम engineers को अपना Copilot CLI agent सीधे इस्तेमाल करने के लिए प्रेरित करने जैसा लगता है
- The Verge के Tom Warren ने सूत्रों के हवाले से कहा कि इस फैसले के पीछे वित्तीय कारण भी हैं, और यह Microsoft के fiscal year end 30 जून से जुड़ा है
- इन दोनों मामलों को AI failure की बजाय ऐसे price fit संकेत के रूप में पढ़ा जा सकता है, जहां product की कीमत ग्राहक पर बोझ डालती है, फिर भी ग्राहक उसे चुनते हैं
- यह उस विचार से मेल खाता है कि अच्छी product pricing वह होती है जिसमें ग्राहक एक पल ठिठककर भी अंततः “हाँ” कहे
- Uber का budget overrun और Microsoft की seat cancellations उसी प्रभाव के वास्तविक उदाहरण लगते हैं

AI labs का खर्च भी बेहद बड़ा है

बड़े AI labs training और inference दोनों पर अरबों डॉलर खर्च कर रहे हैं
सटीक और भरोसेमंद आंकड़े बहुत कम हैं, लेकिन हाल का SpaceX S-1 Anthropic से जुड़ा बड़ा संकेत देता है
SpaceX ने खुलासा किया कि मई 2026 में उसने Anthropic PBC के साथ Cloud Services Agreements किए, जिनसे COLOSSUS और COLOSSUS II की compute capacity तक पहुंच मिलेगी
- Anthropic ने मई 2029 तक SpaceX को हर महीने $1.25 billion देने पर सहमति की
Anthropic की घोषणा कहती है कि इस deal से “Claude Code और Claude API की usage limits बढ़ाई जा सकती हैं”
- इससे मजबूत संकेत मिलता है that Colossus का इस्तेमाल model training नहीं, बल्कि inference के लिए हो रहा है
Anthropic पहले से ही दूसरे providers से भी बहुत बड़ी compute capacity सुरक्षित कर चुका है
- सिर्फ एक vendor की अतिरिक्त capacity पर ही $1.25 billion/माह खर्च करने की तैयारी दिखाती है कि inference budgets कितने बड़े हो चुके हैं

API revenue का सापेक्ष महत्व घटना

पिछले 2 सालों में OpenAI के लिए subscription revenue का हिस्सा बड़ा रहा, जबकि Anthropic के लिए API revenue का हिस्सा अधिक प्रतीत हुआ
ऐतिहासिक रूप से Anthropic का API revenue कुछ बड़े API ग्राहकों पर काफी निर्भर रहा है
- अगस्त 2025 की VentureBeat रिपोर्ट के अनुसार Cursor और GitHub Copilot नाम के दो ग्राहकों का हिस्सा उस समय के $4 billion revenue में $1.2 billion था
अब चर्चा है कि Anthropic दूसरी तिमाही में $10.9 billion revenue तक पहुंच सकता है और पहली बार operating profit भी दर्ज कर सकता है
enterprise shift यह संकेत देता है कि labs ने तय किया है कि मध्यवर्ती distributors को कम करके सीधे ग्राहकों को बेचना ज्यादा लाभदायक है
Anthropic का Claude Code, Cursor और Copilot से सीधे प्रतिस्पर्धा करता है
- Cursor का अपने model में निवेश करना भी इसी संदर्भ में स्वाभाविक लगता है

अप्रैल 2026 एक नया inflection point

नवंबर 2025 वह समय था जब GPT-5.1 और Opus 4.5 अपने-अपने coding agent harness के साथ मिलकर वास्तव में उपयोगी बने, और इसे November inflection point कहा जा सकता है
उसके बाद 6 महीनों में enterprises लगातार उपयोगी काम करने वाले agent systems के अनुकूल होते रहे हैं
अप्रैल 2026 उस तकनीकी बदलाव के revenue effect के गंभीरता से सामने आने का नया inflection point लगता है
- frontier AI labs के लिए लाभकारी दिशा में
- बड़े enterprise budgets पर वास्तविक असर डालने वाली दिशा में
आगे जब Anthropic और OpenAI के IPO के लिए S-1 दस्तावेज़ सार्वजनिक होंगे, तब इस क्षण की वास्तविकता audited numbers से पुष्टि की जा सकेगी

1 टिप्पणियां

GN⁺ 2026-05-28

Hacker News की राय

अगले 5 साल में 5 से 10 ट्रिलियन डॉलर की वसूली करनी होगी, और अगर ऐसा नहीं हुआ तो बढ़ाए गए हार्डवेयर पर depreciation शुरू करना पड़ेगा
इसका मतलब है कि token spending पर हर साल 1 ट्रिलियन डॉलर से ज़्यादा चाहिए होगा। दुनिया भर के 20 करोड़ knowledge workers और 3 करोड़ developers को आधार मानें, तो यह ऐसी दुनिया होगी जहाँ सभी knowledge workers की तनख्वाह का 5%, और developers के मामले में 20%, tokens पर जाना होगा
आसपास जो सुनने में आता है, वह यह है कि ऐसे tools से उन कामों में, जिनकी कंपनियाँ सच में परवाह करती हैं, 20 से 40% तक की speed बढ़ती है। अगर 20% ज़्यादा खर्च पर 20% speed बढ़ती है, तो सालाना 1 ट्रिलियन डॉलर का खर्च सही ठहराना मुश्किल है
हम अभी वहाँ तक नहीं पहुँचे हैं। अभी यह hype cycle के उछाल वाले हिस्से में है, और अगर यह developers को अहम कामों में 2x, 5x, 10x ज़्यादा productive नहीं बनाता, तो बात अच्छी दिशा में जाती नहीं दिखती
- मेरे कुछ विचार हैं। सार्वजनिक जानकारी को ही देखें तो inference cost और training cost का रिश्ता आपस में टकराता हुआ लगता है
  data center से जुड़े electrical engineers training runs के दौरान power usage spikes को design का मुख्य factor बताते हैं, लेकिन cost-optimal scaling पर papers पूरे भरोसे से inference के समय compute को बड़ा factor मानते हैं
  training, amortization के बाद भी, inference से कहीं ज़्यादा compute-intensive है — इसके पक्ष में एक तर्क यह है कि compute resource access में ज़्यादा सीमित Chinese providers बहुत कम कीमत पर लगभग असीमित tokens देते हैं, लेकिन model performance कमज़ोर रहती है। अगर इसकी व्याख्या यह हो कि US कंपनियाँ inference cost को 20 से 30 गुना बढ़ाकर दिखा रही हैं क्योंकि वे वह amortized training cost उठा रही हैं जो विदेशी कंपनियाँ नहीं उठा पाईं, तो बात समझ आती है
  अगर training cost inference से बहुत बड़ी है, तो ये कंपनियाँ सामान्य zero marginal cost competition model से भी कहीं ज़्यादा गंभीर prisoner’s dilemma में हैं। उल्टा, अगर inference cost बड़ी है, तो कुछ thinkers जैसा कहते हैं, utility जैसी business analysis सही हो सकती है। CEOs के पास ऐसा कहने की बहुत बड़ी incentive है। क्योंकि अगर दूसरा विकल्प, यानी prisoner’s dilemma, खुलकर सामने आ गया, तो investment बहुत तेज़ी से रुक जाएगा
  हक़ीक़त को थोड़ा भी छूने वाली चीज़ बस facilities engineers की अफ़वाहें हैं; बाकी सब high-level analysis और एक गुप्त business पर tabletop management जैसा है। यही मौजूदा understanding level दिखाता है
  अगर amortized capex और opex का ratio तक नहीं पता, तो बाहरी investor analysis नामुमकिन है। office planters और indoor plants की accounting को चाहे जितना granular बना लें, अगर business का सबसे बड़ा हिस्सा trade secret के पीछे छिपा है, तो उसका कोई मतलब नहीं
- मैं 150 million डॉलर annual revenue और 9% net margin वाली एक बहुत छोटी कंपनी में काम करता हूँ, और हमारे लिए यह इतना अच्छा है कि हम local model चलाने के लिए hardware पर 100,000 डॉलर खर्च करने पर पहले से विचार कर रहे हैं
  AI-as-a-service पर अनुमानित खर्च एक साल से भी कम समय में उस लागत से आगे निकल जाएगा
  लगता है कि कुछ सालों में ऐसी hardware आ जाएगी जिस पर बहुत छोटी कंपनियाँ भी ज़्यादातर कामों के लिए किफायती दाम में पर्याप्त frontier-grade models चला सकेंगी
- सबकी observations अलग हो सकती हैं, लेकिन मेरी observation भी बहुत अलग नहीं है। बस, वह bottom-up नज़रिये से है। इस समय तक क्या top-down नज़रिया भी नहीं दिखना चाहिए?
  अगर हम potential stage से आगे निकलकर meaningful productivity gains तक पहुँच चुके हैं, तो यह customers के numbers में क्यों नहीं दिख रहा?
  बेहतर software adoption की वजह से पिछले 3 महीनों में Delta Airlines ने operational efficiency में बड़ा सुधार क्यों नहीं किया?
  सच में जिज्ञासा है। कहीं disconnect दिखता है
- मुझे साफ़-साफ़ याद है कि 1990s के आखिर से 2000s की शुरुआत में, जब मैं university student था, तब econometrics के professor ने क्या कहा था
  जब cable TV और Pay Per View आए, तब इस पर research हुई कि अगर लोगों को फिल्मों की unlimited access मिल जाए तो वे कितनी फिल्में देखेंगे, और उसके नतीजे इस business को support करने वाली पूरी infrastructure बिछाने के सबूत की तरह घूमते रहे। लेकिन जब statisticians ने data को और गहराई से देखा, तो निष्कर्ष यह निकला कि लोगों ने जवाब दिया था कि वे हर दिन, हफ़्ते के 7 दिन, रोज़ 10 से 12 घंटे फिल्में देखेंगे। यह असंभव संख्या थी
  अभी भी वैसा ही जहाज़ लगता है। कुछ लोग मान लेते हैं कि हर कोई tokens का अधिकतम इस्तेमाल करेगा, और hardware, software, design और market pressure में सुधार के बावजूद token की कीमत कभी सस्ती नहीं होगी
- एक बात ध्यान में रखने लायक है कि अगले 5 साल में आधार आबादी वैसी की वैसी नहीं रहने वाली
  developer tools की हर पीढ़ी ने absolute code throughput बढ़ाने के साथ नए developer tiers और users पैदा किए हैं
  पहले compiler से लेकर framework युग तक और अब तक हमेशा ऐसा ही हुआ है, और developer बनने के लिए ज़रूरी skill level नीचे आया है। 1980s के मध्य और उत्तरार्ध में master’s या PhD स्तर के computer scientists ही applications लिख पाते थे, फिर यह undergraduate students और IT engineers तक आया, computer science theory ज़्यादातर optional हो गई, फिर यह कुछ training पाए हुए graduates तक आया, और 2022 से पहले retool जैसे no-code/low-code tools के रास्ते v0/Replit जैसी agentic code generation services तक और नीचे जा रहा है
  अगली पीढ़ी के developers पिछली पीढ़ी की तरह applications और architecture नहीं बनाएँगे। यहाँ ज़्यादातर लोग भी शायद pg ने जब यह platform बनाया था उस quality level पर नहीं बना पाएँगे, लेकिन अगर users को value मिलती है तो उससे फ़र्क नहीं पड़ता। अनगिनत मध्यम-गुणवत्ता वाले enterprise applications पहले ही यह साबित कर चुके हैं
  आखिरकार 20 करोड़/3 करोड़ वाले numbers स्थिर नहीं रहेंगे — यही इन businesses का logic है। क्या यह बदलाव capex को justify करने लायक काफ़ी बड़ा और तेज़ होगा? मुझे भी नहीं लगता। लेकिन Web 1, Web 2.0, SaaS, और mobile revolution ने भी नए users और developers की परतें काफ़ी तेज़ी से बनाई थीं, इसलिए इसे पूरी तरह अवास्तविक नहीं कहा जा सकता
  [1] HN custom Lisp implementation होने के कारण एक बड़ा outlier है, लेकिन पहले के दौर में, चाहे चुनाव कुछ अधिक moderate रहे हों, मजबूत architecture पर बने कई उदाहरण थे, और उस तरह की skill आज की founder generation में ढूँढना मुश्किल हो सकता है
यह विश्लेषण उलझा हुआ है। coding वाले product-market fit (PMF) तक शायद पिछले साल ही पहुँचा जा चुका था। profitability अलग मुद्दा है, और उसका अभी पता नहीं है
लेख इन दोनों को मिलाता है, लेकिन कोई मजबूत आर्थिक तर्क या भरोसेमंद आँकड़े नहीं देता। यह भी समझ नहीं आता कि Uber का उदाहरण क्यों प्रासंगिक है। Uber के COO ने भी साफ कहा था कि कम-से-कम ROI के नज़रिये से नतीजे दिख नहीं रहे
मेरे हिसाब से यह product कुछ महीने पहले से ही coding में बहुत उपयोगी था। लेकिन किसी भी cost पर उपयोगी बिल्कुल नहीं
- उलझन की बात यह है कि लोग शायद trajectory को नज़रअंदाज़ कर रहे हैं। जबकि शायद वही सबसे अहम हिस्सा है, और वही दब गया है
  Simon ने जैसा कहा, “काफी अच्छा” coding agent आए अभी सिर्फ 6 महीने हुए हैं, और वह तो पलक झपकने जितना समय है। लेकिन हमारी company में मेरा काम पूरी तरह बदल गया है और यह लगभग सपने जैसा है
  और वह तो बस एक inflection point है। ऐसे कई inflection point पहले ही आ चुके हैं और आगे और भी आने वाले हैं। यह बात मानने लायक है कि आज की तारीख में बेतुके corporate spend पर ROI positive न हो, लेकिन कुछ महीनों बाद, और फिर कुछ साल बाद जो आने वाला है, उसके लिए अभी रास्ता तैयार करना पूरी तरह तर्कसंगत है
- PMF एक अजीब तरह से परिभाषित concept है, जैसे “अगर पक्का नहीं है कि है, तो है ही नहीं”
  जिन लोगों ने समय लगाकर इसे इस्तेमाल किया और समझा, उनके लिए यह कुछ महीने पहले से ही साफ तौर पर उपयोगी था। लेकिन अब वह समझ उन लोगों तक भी पहुँच गई है जो budget नियंत्रित करते हैं, और वे आश्वस्त हो गए हैं कि यह सिर्फ fad या hype नहीं है, इसलिए अब PMF का “दावा” किया जा सकता है
  फिर भी, मैं इससे सहमत हूँ कि “उन लोगों के पास PMF है” कहना अजीब है। आम तौर पर यह अपने product के बारे में परिभाषित किया जाने वाला concept है
- सही। cost भी economics का हिस्सा है
  इसलिए यहाँ बहुत से लोगों के लिए बेहतर होगा कि वे इस चर्चा में न पड़ें। ये लोग सिर्फ फ़ायदों को दोहराते रहते हैं, लेकिन cost और उस cost का company की financial health पर क्या असर पड़ता है, उसे पहचानते या समझाते नहीं
- यह लेख “अच्छा” शब्द पर बहुत ज़्यादा भार डालता है, इसलिए इसका analysis संदिग्ध लगता है
  “हमने 2025 के नवंबर को नवंबर inflection point इसलिए कहा, क्योंकि GPT-5.1 और Opus 4.5 अपने-अपने coding agent harness के साथ जुड़कर बेहतर हो गए। वे इतना अच्छे हो गए कि उपयोगी कामों को भरोसेमंद ढंग से पूरा कर सकें, और पिछले 6 महीनों में हम agent systems के अनुरूप ढलते रहे हैं”
- ज़रूरी नहीं कि यह कोई logical लेख हो। यह LLM evangelism blog के ज़्यादा क़रीब है, और industry के प्रति अनुकूल न होने वाला critical analysis लगभग है ही नहीं
  इसकी दूसरी posts पढ़ो तो skepticism भी बहुत कम दिखता है, ज़्यादा सामग्री बस यह बताती है कि सब कितना महान है
इस लेख में थोड़ा AI psychosis जैसा एहसास है
“ये tools बहुत ज़्यादा tokens जलाते हैं, लेकिन तेज़ी से उन रोज़मर्रा के tools में बदल रहे हैं जिनका इस्तेमाल बहुत ऊँचा पारिश्रमिक पाने वाले experts करते हैं”
“किसी तरह यह अंश ‘Uber COO ने कहा कि AI token overspend को justify करना कठिन होता जा रहा है’ जैसी headline में बदल गया, क्योंकि AI failure stories का बाज़ार अब भी बहुत बड़ा है”
हाँ, ज़रूर, बस AI की विफलता देखने की इच्छा भर है। ऐसा तो हो ही नहीं सकता कि cost बेकाबू हो रही हो, revenue record स्तर पर हो, और बड़े पैमाने पर layoffs भी हो रहे हों। यह संभावना भी नहीं होगी कि पहले से ही ऊँचा पारिश्रमिक पाने वाले लोग इन tools पर पैसा जला रहे हों और फिर भी “value” में कोई बढ़ोतरी पैदा न कर पा रहे हों। output 100x है, लेकिन result हर metric पर सपाट है — यह बात मैं मानता हूँ
[1] https://cmr.berkeley.edu/2025/10/seven-myths-about-ai-and-pr...
[2] https://futuretech.mit.edu/publication/crashing-waves-vs-ris...
- psychosis से आपका ठीक-ठीक क्या मतलब है?
अगर GLM-5.1 लगभग उतना ही अच्छा है, open source है, और बहुत सस्ता है, तो OpenAI और Anthropic ग्राहकों को अपने साथ बनाए रखने की क्या योजना रखते हैं?
बिज़नेस मॉडल काम करता हुआ नहीं लगता। मेरा एक बहुत करीबी दोस्त वास्तव में बड़े enterprises के लिए automation software बनाता है, और वह Claude या OpenAI का बिल्कुल इस्तेमाल नहीं करता
वह भारी reasoning वाले कामों के लिए मुख्य रूप से Cerebras पर gpt 120b और GLM-5.1 इस्तेमाल करता है, और कई तरह के कामों के लिए दूसरे छोटे models इस्तेमाल करता है। सब कुछ open source है
ये सिस्टम enterprises के लिए बहुत उपयोगी हैं, और बहुत स्थिर व तेज़ पूरी तरह automated pipelines चला सकते हैं
हम इस विषय पर अक्सर बात करते हैं, और हम दोनों को लगता है कि Claude और OpenAI के साथ भारी agent काम करने वाली कंपनियाँ शायद ठीक से नहीं समझतीं कि पिछले 1 साल में open source कितना बेहतर और सस्ता हो गया है
तो जब मौजूदा enterprises और developers इसकी बराबरी कर लेंगे, तब क्या Claude और OpenAI अपनी लागत भी वसूल नहीं कर पाएँगे?
- GLM-5.1 उसी स्तर का नहीं है। Claude Code का Opus उसके सामने टिकता नहीं। खुद इस्तेमाल करके देख लो। open source models कम से कम 1 साल पीछे हैं
- इस बात से सहमत हूँ कि बिज़नेस मॉडल दिखता नहीं। Porter के 5 forces के नज़रिए से यह एक बुरा सपना है
  इस क्षेत्र में बहुत बड़ी संख्या में कंपनियाँ प्रतिस्पर्धा करेंगी, और capital intensive होने की वजह से कुछ हद तक moat तो होगा, लेकिन फिर भी व्यावहारिक रूप से प्रतिस्पर्धियों की संख्या लगभग अनंत होगी
  उपभोक्ताओं के लिए यह अच्छा है
- coding के लिए हमेशा उस क्षेत्र का सबसे अच्छा model इस्तेमाल करना चाहिए, न कि वह model जो 1 साल पहले शायद सबसे अच्छा होता। GLM 5.1 ठीक उसी जगह पर है
  मैं यह एक बड़े प्रशंसक के तौर पर कह रहा हूँ, क्योंकि translation site में इसका price-performance मुझे काफ़ी अच्छा लगता है
  अभी ज़्यादातर पैसा coding में है। अगर OpenAI और Anthropic cutting-edge open source models से सिर्फ 6 महीने भी आगे रहें, तो वे enterprise और developer market का अधिकांश हिस्सा ले सकते हैं
- coding सहायता के लिए मैंने OpenRouter के ज़रिए OpenCode में कई बड़े open models इस्तेमाल किए हैं, और वे सब Claude Opus की तुलना में काफ़ी कमजोर लगे
  क्या आप कोई संकेत दे सकते हैं कि open models से अधिक value पाने के लिए उन्हें कैसे handle किया जाए?
  इस आम बात से मैं सहमत हूँ कि open models लगभग 1 साल पीछे हैं। लेकिन लगभग 1 साल पहले state-of-the-art models अचानक जादुई रूप से बेहद उपयोगी हो गए थे। इस तर्क के अनुसार open models को भी जल्द अच्छा काम करना चाहिए, लेकिन मुझे चिंता है कि शायद सिर्फ पृथ्वी का एक और चक्कर पूरा होने का इंतज़ार करने से ज़्यादा कुछ और भी है
  संदर्भ के लिए, मेरा use case coding assistance है। दूसरे उद्देश्यों में open models शानदार हो सकते हैं
- क्या इन models को चलाने के लिए, जिन्हें “frontier models जितना अच्छा” कहा जा रहा है, 5,000~10,000 डॉलर खर्च नहीं करने पड़ते?
  self-hosted coding model चलाने के ROI पर मैंने कभी कोई ठोस विश्लेषण नहीं देखा, खासकर जब इसकी तुलना 20 डॉलर या 200 डॉलर प्रति माह plans से की जाए
“200 डॉलर में 2,180.16 डॉलर के tokens” वाली बात अजीब लगती है
tokens की कोई अंतर्निहित लागत या मूल्य नहीं होता। यह कहना कि आपने 2,180.16 डॉलर के tokens इस्तेमाल किए, वैसा ही है जैसे किसी salesman की इस बात पर यक़ीन करना कि 19.99 डॉलर का बर्तन-सेट 1 अरब डॉलर का है
पक्षपाती स्रोत का मूल्यांकन करते समय आलोचनात्मक सोच को खिड़की से बाहर फेंक देना काफ़ी हास्यास्पद है
- मुझे ठीक से समझ नहीं आ रहा कि यहाँ किस बात का खंडन किया जा रहा है
  मैंने 200 डॉलर खर्च किए। अगर API pricing के हिसाब से भुगतान किया होता, तो वह 2,180.16 डॉलर होता। लेख का बिंदु यह है कि enterprise ग्राहक API pricing चुकाते हैं, और अगर मैं ऐसी किसी कंपनी में काम कर रहा होता, तो मैंने कंपनी पर 2,180.16 डॉलर की लागत डाली होती
  मुझसे क्या छूट रहा है?
- tokens की निश्चित रूप से गणना की जा सकने वाली अंतर्निहित लागत होती है। production का marginal cost, यानी inference cost, और उस model पर लगे amortized R&D cost भी होते हैं जो उन tokens को बनाता है
  value की गणना करना मुश्किल है, लेकिन सौभाग्य से market pricing mechanism उसी काम के लिए मौजूद है। लोग जितना भुगतान करने को तैयार हैं, उससे बेहतर कोई संख्या नहीं
  इसलिए enterprise plan में 2,180.16 डॉलर खर्च होते हैं। लेखक खुद उतना नहीं देता, लेकिन enterprise देता है
- मेरे project के हिसाब से मोटे अनुमान में OpenRouter पर per-token भुगतान करना, उसी open-weight model को rented GPU पर चलाने की तुलना में प्रतिस्पर्धी है, और कभी-कभी उससे सस्ता भी पड़ता है
  per-token pricing बंद frontier models और open-weight models दोनों में लगभग एक ही दायरे में है, यानी प्रति million tokens कुछ cents से कुछ dollars तक। मुझे यह इस बात का संकेत लगता है कि यह pricing कुछ हद तक वास्तविकता पर आधारित है
- ज़रा सा आलोचनात्मक ढंग से सोचें तो उस वाक्य का अर्थ साफ़ है: “मौजूदा API pricing के हिसाब से 2,180 डॉलर के tokens”
- निश्चित ही अंतर्निहित लागत होती है। न्यूनतम आधार बिजली का बिल है। पक्षपाती स्रोतों का मूल्यांकन करते समय आलोचनात्मक सोच को छोड़ देना सच में हास्यास्पद है
असली timing इस बात में है कि अभी मज़बूत नए business demand की कमी है, और काफ़ी तकनीकी assets जमा हो चुके हैं, इसलिए काम धीरे-धीरे incremental work बनता जा रहा है
यानी विशाल पुराने काम के ऊपर स्थिर features बनाए जा सकते हैं, और यही वह जगह है जहाँ AI खास तौर पर चमकता है। इसलिए AI हो या न हो, अगर ज़्यादातर काम एक feature जोड़ना, एक bug ठीक करना, या थोड़ा configuration बदलना जैसे incremental काम हैं, तो कंपनियाँ वैसे भी कम software engineers भर्ती करतीं। AI ने बस उस दबाव को तेज़ कर दिया है
उल्टा, अगर कल्पना करें कि यही AI 20 साल पहले होता, तो बात अलग होती। जब लोग अभी JAX-RS को समझने की कोशिश कर रहे थे, तब क्या AI सच में Jersey का इस्तेमाल कर पाता? जब React अभी-अभी आया था, तब क्या वह React पर हर सवाल का जवाब दे पाता? क्या वह public cloud infrastructure या तथाकथित big data platforms बनाने में लोगों की संख्या 10वें हिस्से तक घटा पाता? उस समय चीज़ें तेज़ी से बदल रही थीं, इसलिए अनगिनत संभावनाओं की पड़ताल करने के लिए बहुत सारे engineers चाहिए होते। मुझे इस बात पर भी बहुत संदेह है कि AI machine learning ecosystem को 10वें हिस्से की workforce के साथ बना पाता। 20 साल पहले R का दौर था और Python ecosystem बिल्कुल mature नहीं था। mobile computing में भी यही बात लागू होती है: क्या AI मोबाइल apps और उनके underlying infrastructure बनाने वाले लोगों की संख्या 10वें हिस्से तक घटा देता?
- “क्या AI React के बारे में हर सवाल का जवाब दे पाता?” — context learning (ICL) की वजह से, मुझे लगता है हाँ
  “क्या वह public cloud infrastructure या big data platforms को 10वें हिस्से की workforce के साथ बना पाता?” — इसके लिए मैं नहीं कहूँगा। वह मूल समस्याएँ हल नहीं कर पाता, और scale बढ़ने पर चीज़ें बिगाड़ देता
  incremental work वाली बात सही है। लेकिन ऐतिहासिक रूप से भी ज़्यादातर काम incremental ही रहे हैं, और R&D roles हमेशा अल्पसंख्यक रहे हैं
मानना पड़ेगा जहाँ मानना चाहिए। यह पूरा मामला इतिहास का सबसे बड़ा धोखा है
AI के कुछ उपयोगी use case हैं, लेकिन मौजूदा कीमत पर नहीं। मैं GPT-2 के समय से ही काफ़ी heavy users के साथ AI इस्तेमाल करता आया हूँ। हर user एक ही कहानी बताता है। जिज्ञासा, हैरानी, hype, नफ़रत, फिर समझ। कंपनियाँ आम तौर पर थोड़ा देर से आती हैं, और अभी हम hype cycle में हैं। यही वह बिंदु है जहाँ सब contracts बेचते हैं और IPO करते हैं
सचमुच यह VC की textbook चाल है
गलतफ़हमी नहीं होनी चाहिए कि AI के उपयोगी case हैं। बस वैसे नहीं जैसे वे चाहते हैं। यह blockchain से काफ़ी मिलता-जुलता है। decentralized currency का विचार मौजूद रहने लायक है। बाकी 99% coins नहीं
AI एक तेज़ लेकिन अब भी कम accurate search engine है। bugs ढूँढने में शानदार है और rubber duck debugging के लिए भी अच्छा है
मैं इसे धोखा इसलिए कहता हूँ क्योंकि marketing के साथ दुनिया भर के अनगिनत लोगों को यह impression दिया जाता है कि अब वे खुद सीखे बिना startup, game, infrastructure वगैरह बना सकते हैं। उसका नतीजा लाखों abandoned low-quality projects और products हैं। ज़्यादातर ने किसी समस्या को पूरी तरह हल करने के लिए ज़रूरी mental models कभी बनाए ही नहीं। अंत में वे महीनों और पैसे बर्बाद करते हैं और सिर्फ tokens जलाते हैं। मैं इसे धोखा कहता हूँ
जितने भी early adopters को मैं जानता हूँ, उन सबने पैसे की वजह से नहीं बल्कि नए use case न मिलने की वजह से इस्तेमाल बहुत कम कर दिया है। नया project explore करते समय तेज़ी से onboarding करो, बहुत कुछ सीखो, फिर docs और असली testing पर चले जाओ। पिछले 2 साल में मेरा usage सबसे कम है
मैं AI को अपने code को छूने नहीं दूँगा। डर लगता है कि फिर मुझे ही उसके पीछे-पीछे साफ़ करना पड़ेगा। हाँ, मैं उससे अपना code पढ़वाकर यह ज़रूर पूछता हूँ कि मुझसे क्या गलती हुई, ताकि मैं खुद को बेहतर कर सकूँ
open source solutions समेत सैकड़ों कंपनियाँ इतना तो दे ही सकती हैं
मेरे सभी non-technical दोस्त अभी hype cycle में हैं, और आगे आने वाला उत्साह और फिर तयशुदा निराशा मुझसे साझा करते रहते हैं
एक अर्थ में यह प्रभावशाली है कि AI का, जानबूझकर या अनजाने में, इतनी पूरी तरह VC-स्टाइल में इस्तेमाल हुआ है कि पूरी दुनिया के सामने विशाल कंपनियाँ खड़ी हो गईं
- मैं मूल दावे को समेटने की कोशिश कर रहा हूँ, क्या तुम मदद कर सकते हो
  क्या मतलब यह है कि token इस्तेमाल करने वाले coding models का ROI positive नहीं है, इसलिए यह धोखा है? जैसे वे महीने के 100 डॉलर वसूलने लायक काफ़ी value पैदा नहीं कर पाते?
  क्या मतलब यह है कि enterprise customers इतना देखने भर के लिए भी काफ़ी समझदार नहीं हैं?
  आखिरकार क्या यह blockchain-जैसा मृगतृष्णा-नुमा खेल है, और IPO CEO की कमाई maximize करने के लिए किया जाता है?
  क्या मैंने सही समझा, या मैं तुम्हारी बातों में अपने शब्द जोड़ रहा हूँ?
  “लोगों को यह impression देना कि अब वे खुद सीखे बिना अपना startup, game, infrastructure बना सकते हैं” — यह लोगों की मान्यताओं और motivations को तय मान लेना है; क्या यह strawman नहीं है? AI इंसानों को amplify करने वाला एक शक्तिशाली tool है। आप सिर्फ prompt में “मेरे लिए 1 billion dollar value वाला enterprise SaaS app बना दो” या “मेरे लिए GTA6 बना दो, hallucinate मत करना” नहीं लिख सकते। लेकिन क्या वाकई ऐसा impression बन रहा है? क्या Dario और Sam यह कह रहे हैं कि “हमारे coding agent की subscription लो, बिना technical skill के एक ही बार में game बनाओ और अमीर बन जाओ”?
  यह पूरी तरह संभव है कि आज भी तुम्हें AI agents में value न दिखे। यूँ ही असहज लग सकता है। लेकिन इसे blockchain-स्तर का धोखा कहना मुझे बहुत बड़े signals, और इस बारे में हो रही वास्तविक बातचीत — कि ये systems आज क्या कर सकते हैं और साल के अंत तक इनके क्या करने की उम्मीद है — के खिलाफ़ जाता हुआ लगता है
मैंने जितना पढ़ा है, उसके हिसाब से Anthropic वास्तव में profitable नहीं है; शायद discounts की वजह से कुछ समय के लिए profitable दिखा होगा। यह लेख उस दावे को अच्छी तरह रखता है: https://www.wheresyoured.at/anthropics-profitability-swindle...
मुझे इस पर भी शक है कि मौजूदा price increases काफ़ी हैं, और इस पर भी कि आगे ज़रूरी होने वाले और बड़े price increases को ज़्यादातर users और enterprises स्वीकार करेंगे। खासकर individual users के लिए $200/महीना पहले ही बहुत महँगा है, और नहीं लगता कि ज़्यादातर लोग $1,000/महीना जैसी कीमत देंगे
LLM से जुड़ी ख़बरों को शायद इन कंपनियों के IPO होने तक बस नज़रअंदाज़ करना चाहिए। सकारात्मक जनमत गढ़ने वाले bots बहुत हैं
seat के हिसाब से $200/महीना कुछ भी नहीं है
हमारे R&D group के लोग जो 3D CAD license package इस्तेमाल करते हैं, उनमें एक seat की कीमत ही हज़ारों डॉलर प्रति महीना पड़ती है
अब software seats को भी थोड़ा प्यार मिलने का समय आ गया है
- AutoCAD की कीमत $175/महीना प्रति user है [1]
  [1] https://www.autodesk.com/products/autocad/buy
- सही है, यह कुछ भी नहीं है, लेकिन enterprise वास्तव में इतना भुगतान नहीं कर रहा। जैसा लेख में है, कीमत $20/महीना प्रति seat है, और उसके ऊपर token के हिसाब से API usage fees हैं
  enterprise fixed plan वाले “unlimited buffet” के लिए नहीं, बल्कि usage-based pricing दे रहे हैं
- मैंने जो सबसे महँगा CATIA license देखा है, वह भी लगभग $600/महीना प्रति user है। “हज़ारों डॉलर” प्रति seat आपने कहाँ देखा?
- अब अगर engineer salaries भी जोड़ो, तो समझ में आता है कि software seats पहले से ही उन R&D seats से ज़्यादा महँगी हैं
- क्या CAD हर कामकाजी इंसान का tool बनने वाला है?

मुझे लगता है कि Anthropic और OpenAI ने product-market fit पा लिया है

enterprise ग्राहक API कीमतें चुकाना शुरू कर रहे हैं

यह निष्कर्ष कि product-market fit हासिल हो गया है

hiring expansion से दिखता enterprise focus

AI failure stories की तरह पेश किए जाने वाले cost विवादों का आधार कमजोर है

Uber मामला

Microsoft मामला

AI labs का खर्च भी बेहद बड़ा है

API revenue का सापेक्ष महत्व घटना

अप्रैल 2026 एक नया inflection point

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News की राय