• LLM टोकन लागत हर साल 10 गुना घटने की उम्मीद के विपरीत, AI subscription services की profitability लगातार खराब होती जा रही है
  • नवीनतम LLM models की मांग हमेशा शीर्ष स्तर के (SOTA, State-of-the-art) models पर केंद्रित रहती है, इसलिए “पुराने” models की कीमत में गिरावट वास्तविक cost savings में नहीं बदलती
  • जैसे-जैसे model performance बढ़ती है, इस्तेमाल होने वाले tokens की मात्रा geometric rate से बढ़ती है, जिससे प्रति-token कीमत में गिरावट बेअसर हो जाती है और कुल लागत उलटे तेजी से बढ़ती है
  • unlimited subscription plans के प्रयोग (जैसे Claude Code $200/माह) भी heavy users के token explosion के कारण टिकाऊ नहीं हैं
  • लंबे समय में usage-based pricing के अलावा कोई टिकाऊ मॉडल नहीं है, लेकिन startup competition और consumer resistance के कारण इसे व्यवहार में लाना कठिन है
  • अगर sustainable revenue model की ओर बदलाव नहीं हुआ, तो अधिकांश startups अंततः दिवालिया होने के जोखिम का सामना करेंगे

AI subscription business: token unit price गिरने के बावजूद घाटा ही क्यों बढ़ रहा है

LLM कीमत गिरने का भ्रम

  • संस्थापक अक्सर इस VC playbook पर भरोसा करते हैं कि "token unit price 10 गुना-10 गुना घटेगी, इसलिए बस कुछ समय टिके रहो, फिर business high-margin structure में बदल जाएगा"; इसी भरोसे वे शुरुआती दौर में subscription products को लागत-स्तर पर या घाटे में चलाते हैं
  • वास्तव में GPT-3.5 जैसे पुराने models की token unit price 10 गुना से अधिक गिरी है, लेकिन users और market demand हमेशा सबसे नए और सर्वश्रेष्ठ प्रदर्शन वाले (SOTA) models पर ही केंद्रित रहती है
  • हकीकत में 18 महीने बाद भी margins सुधरने के बजाय और बिगड़ते दिखते हैं
  • पुराने models की कीमत में कटौती का असर तभी महसूस होता है जब वे "कल के अखबार" की तरह पहले ही market interest से बाहर हो चुके हों

नवीनतम models की कीमत और demand structure

  • GPT-4, Claude 3 Opus जैसे नवीनतम models हमेशा लगभग समान ऊंची कीमत पर लॉन्च होते हैं, और पुराने models चाहे जितने सस्ते हो जाएं, उनका वास्तविक usage बहुत कम रहता है
  • users को सिर्फ "best performance" चाहिए; "सस्ते पुराने models" कार बाजार की पुरानी second-hand cars जैसे हैं
  • AI इस्तेमाल करते समय लोग वास्तव में सबसे बेहतरीन परिणाम चाहते हैं, इसलिए पैसे बचाने के लिए पुराना model स्वेच्छा से इस्तेमाल करने के मामले दुर्लभ हैं
  • आखिरकार market में competitive बने रहने के लिए हमेशा सबसे महंगा, सबसे नया model देना पड़ता है, और इसी वजह से लागत बनी रहती है
    • यह कुछ ऐसा है जैसे 90 के दशक की used cars की कीमत गिर जाए, लेकिन consumer फिर भी नई car ही खरीदे

token usage में विस्फोटक बढ़ोतरी

  • model performance बढ़ने के साथ एक ही task में खर्च होने वाले tokens की संख्या geometric rate से बढ़ने लगी है
  • पहले जो काम 1,000 tokens में खत्म हो जाता था, अब वह 100,000 tokens तक खपा सकता है
  • पहले एक वाक्य के सवाल का एक वाक्य के जवाब से काम हो जाता था, लेकिन अब complex research, loops और orchestration की वजह से systems 10~20 मिनट तक लगातार चलते हैं और भारी token usage पैदा करते हैं
  • AI से अधिक गहरा research/analysis करवाने के कारण "एक run में 20 मिनट, दिन के 24 घंटे लगातार run" जैसी स्थिति बनती है, जिससे प्रति user औसत दैनिक usage तेजी से बढ़ता है
    • उदाहरण के लिए, अगर कोई user रोज सिर्फ 1 बार $1 के बराबर का 'deep research' इस्तेमाल करे, तब भी $20 subscription fee पर यह model टिकाऊ नहीं रहता
  • unit price में गिरावट कुल token consumption में बढ़ोतरी से offset हो जाती है, और $20/माह की plan में रोजाना एक $1 का task भी उठाना मुश्किल हो जाता है

unlimited plans की विफलता

  • Anthropic का Claude Code आदि $200/माह unlimited plan, automatic token optimization, user PC utilization जैसे कई cost-cutting उपाय आजमा चुके हैं
  • लेकिन कुछ power users ने एक महीने में 10 billion tokens तक इस्तेमाल कर लिए ("War and Peace" की 12,500 प्रतियों के बराबर), क्योंकि users ने automation, repeated tasks और loops का इस्तेमाल कर token consumption को विस्फोटक बना दिया
    • "AI usage इंसानी समय से अलग होकर API को 24 घंटे चलाता है और token frenzy पैदा करता है"
  • engineering innovation के बावजूद आखिरकार plan rollback करना पड़ा
  • निष्कर्ष: अब unlimited subscription model संभव नहीं है, यह गणित ही नहीं बैठता

पूरे industry के सामने खड़ी दुविधा

  • अगर subscription model पर अड़े रहे, तो profitability गिरने और collapse का जोखिम बढ़ता जाएगा
  • सभी AI कंपनियां जानती हैं कि usage-based pricing ही जवाब है, लेकिन अगर subscription-based competitor आ जाए तो users churn कर सकते हैं
  • "prisoner's dilemma" जैसी स्थिति में सभी को power-user subsidy competition में धकेला जा रहा है
  • Cursor, Replit आदि भी "पहले growth, profitability बाद की समस्या" वाले दृष्टिकोण से चल रहे हैं, लेकिन अंततः profitability issue के कारण restructuring से बचना मुश्किल होगा

व्यवहारिक समाधान: 3 रास्ते

  • 1. usage-based pricing
    • अगर शुरुआत से ईमानदार आर्थिक मॉडल अपनाया जाए, तो लागत से ऊपर revenue structure डिजाइन किया जा सकता है। लंबे समय में यही एकमात्र sustainable model है
    • लेकिन consumers metered billing को बेहद नापसंद करते हैं, इसलिए mass adoption मुश्किल है
  • 2. ऊंची switching cost वाले enterprise market को target करना
    • ऊंची switching cost वाले enterprise customers (जैसे बड़े corporates, financial institutions) को B2B sales के जरिए onboard किया जाए, तो एक बार market में entry के बाद churn लगभग असंभव हो जाता है और margins ऊंचे रहते हैं
    • system of record (SOR, CRM/ERP/EHR आदि) क्षेत्र इसका प्रमुख सफल उदाहरण है (जैसे Goldman Sachs के 40,000 engineers के लिए adoption)
  • 3. vertical integration के जरिए value creation
    • Replit की तरह LLM inference को खुद नुकसान उठाकर एक 'bait product' की तरह दिया जाए, और उसके ऊपर बनी hosting, database, deployment, monitoring जैसी कई services से revenue कमाया जाए
    • ऐसा ढांचा बनाया जाए जिसमें AI usage बढ़कर infrastructure market तक पहुंचे
  • आगे भी token unit price घटती रहेगी, लेकिन user expectations और usage भी geometric rate से बढ़ते रहेंगे
  • जो कंपनियां सिर्फ subscription-plus-growth strategy पर टिकी रहेंगी, उनके लिए अंततः 'महंगे अंतिम संस्कार' जैसी स्थिति का जोखिम बहुत अधिक है

सारांश

  • "अगले साल token 10 गुना सस्ते हो जाएंगे" जैसी आशावादी सोच भर से business नहीं चल सकता
    • users हमेशा ज्यादा ऊंची expectations और ज्यादा usage की मांग करेंगे
  • model advancement = usage explosion = cost increase का सूत्र अब साफ दिख रहा है, और sustainable AI business को आखिरकार usage-based billing, large enterprise contracts, और vertical integration के जरिए नई संरचना की ओर बढ़ना होगा
    • अगर business को टिकाए रखना है, तो 'Neocloud' strategy जैसी नई structural approach की जरूरत होगी

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.