12 पॉइंट द्वारा GN⁺ 2025-08-22 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • MIT रिपोर्ट के अनुसार दुनिया भर की 95% कंपनियाँ generative AI अपनाने से वास्तविक मुनाफा नहीं कमा पाईं
  • कंपनियों ने ChatGPT, Copilot जैसे large language models का बड़े पैमाने पर प्रयोग किया, लेकिन अधिकांश उपयोग productivity बढ़ाने तक सीमित रहा
  • सफलता के उदाहरण केवल 5% integrated AI pilots में ही मिले, और अधिकांश मामलों में revenue या profit पर कोई असर नहीं पड़ा
  • generative AI का वास्तविक work processes के साथ ठीक से fit न होना, feedback याद न रख पाना, और context के अनुसार adapt न कर पाना मुख्य कारण बताए गए
  • रिपोर्ट बड़े पैमाने पर jobs replace होने की आशंकाओं को खारिज करते हुए कहती है कि external cost reduction तो संभव है, लेकिन internal restructuring या mass layoffs फिलहाल व्यावहारिक नहीं हैं
  • निष्कर्ष यह है कि AI की ताकत strategy में नहीं बल्कि specific tasks में है, इसलिए कंपनियों को company-wide innovation के बजाय सीमित और तुरंत परिणाम देने वाले क्षेत्रों पर ध्यान देना चाहिए

कंपनियों का generative AI निवेश और रिटर्न

  • पिछले 3 वर्षों में कंपनियों ने generative AI projects में $30~40 billion का निवेश किया
  • लेकिन वास्तविक business return पाने वाली कंपनियाँ बहुत कम हैं
  • MIT के नए अध्ययन में 95% कंपनियों ने कहा कि AI अपनाने के बाद भी कोई measurable gain नहीं मिला
  • केवल 5% AI pilot projects ही millions of dollars के स्तर का value create कर रहे हैं

large language models अपनाने की स्थिति और सीमाएँ

  • 80% से अधिक बड़ी कंपनियाँ ChatGPT, Copilot जैसे प्रमुख LLMs को test कर चुकी हैं या pilot रूप में चला रही हैं
  • लगभग 40% कंपनियों ने इन systems को कुछ हद तक अपनाया है, लेकिन अधिकांश उपयोग कर्मचारियों की individual productivity बढ़ाने तक सीमित है
  • कंपनियों के कुल revenue या profit में सुधार पर इसका लगभग कोई असर नहीं है

generative AI की तकनीकी सीमाएँ

  • generative AI tools अक्सर वास्तविक business processes के साथ ठीक से मेल नहीं खाते
    • प्रमुख समस्याओं में unstable workflows, context learning की कमी, और inefficient task linkage शामिल हैं
  • अधिकांश generative AI models पिछला feedback संरक्षित नहीं रख पाते और context या tasks के बीच सीख को transfer करना कठिन होता है
  • रिपोर्ट के अनुसार, ज्यादातर GenAI systems feedback retention, context adaptation, और long-term improvement करने में सक्षम नहीं हैं
  • इन कारणों से कंपनियों में long-term integration cost बढ़ती है, लेकिन वास्तविक efficiency gains सीमित रहते हैं

business expectations और वास्तविकता का अंतर

  • generative AI को लेकर उम्मीदें और निवेश बहुत बड़े थे, लेकिन वे cost reduction या वास्तविक profit generation में नहीं बदल सके
  • व्यवहार में इसका उपयोग customer service, marketing, document writing जैसे सीमित कामों में हो रहा है, जहाँ समय तो बचता है लेकिन सीधे revenue growth पर प्रभाव कम है

रोजगार और संगठनात्मक ढाँचे पर प्रभाव

  • generative AI से कम समय में बड़े पैमाने पर jobs घटने की आशंका के पक्ष में ठोस आधार नहीं हैं
  • AI का प्रभाव कंपनी के अंदर workforce restructuring से अधिक, outsourcing cost जैसे external costs को optimize करने तक सीमित रहने की संभावना है
  • यानी तुरंत बड़े पैमाने पर कर्मचारियों को replace करने के बजाय यह outsourcing cost कम करने के स्तर तक ही सीमित रह सकता है

तकनीकी गलतफहमियाँ और विकास की सीमाएँ

  • कई कंपनियाँ AI की वास्तविक क्षमता और सीमाओं को सही तरह से नहीं समझ पाईं, जिससे अनेक असफलताएँ हुईं
  • generative AI तेज़ी से text या code बना सकता है, लेकिन इंसानों जैसी निरंतर learning या flexibility उसमें नहीं है
  • उदाहरण के लिए, कर्मचारी पिछली गलतियों और नई आवश्यकताओं के अनुसार लचीले ढंग से काम कर सकते हैं, लेकिन AI में ऐसी निरंतर memory transfer संभव नहीं है

निवेश और आगे की दिशा

  • निवेशक और management AI technology में लगातार प्रगति की उम्मीद कर रहे हैं, लेकिन short term में प्रगति अपेक्षा से धीमी है
  • रिपोर्ट संकेत देती है कि हर industry और workflow में तुरंत AI लागू करना अभी जल्दबाज़ी होगी
  • संगठनों को ऐसे सीमित क्षेत्रों में implementation पर ध्यान देना चाहिए जहाँ तुरंत और measurable impact संभव हो
    • उदाहरण: customer support automation, developer support tools, document drafting आदि
  • पूरी कंपनी में AI integration अभी भी high risk वाला है और failure की संभावना अधिक है

निष्कर्ष और संकेत

  • generative AI से corporate value creation कुछ ही success cases तक सीमित है
  • अधिकांश कंपनियों को रोज़मर्रा के कामों में सिर्फ मामूली मदद मिल रही है
  • रिपोर्ट इस बात पर ज़ोर देती है कि कंपनियों को generative AI को पूर्ण growth engine नहीं, बल्कि एक सीमित tool के रूप में देखना चाहिए
  • उम्मीदें ऊँची हैं, लेकिन जब तक मौजूदा systems इंसानों की तरह adapt नहीं कर पाते, कंपनियों के लिए AI से बड़ा मुनाफा कमाना मुश्किल रहेगा

1 टिप्पणियां

 
GN⁺ 2025-08-22
Hacker News राय
  • इस हफ्ते इस पर डुप्लिकेट चर्चा हो चुकी थी (162 टिप्पणियाँ) https://news.ycombinator.com/item?id=44941118 और उस लेख में लिंक नहीं की गई असली source report यह है: https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf
  • कहा गया कि यह report लेख की सामग्री से बिल्कुल अलग बात कहती है, इसलिए कुछ जानकारी साझा की गई: असफल बजट का 50% marketing और sales पर खर्च हुआ, AI 2.3 ट्रिलियन डॉलर के labor value को automate कर सकता है, 3.9 करोड़ positions पर असर पड़ सकता है, और विफलता के शीर्ष कारण नए tools अपनाने से इनकार और management support की कमी हैं। मुझे लगता है कि लोग बहुत जल्दी यह निष्कर्ष निकाल रहे हैं कि AI काम नहीं करता। report यह नहीं कहती।
    • इसमें कहा गया कि "AI 2.3 ट्रिलियन डॉलर के labor value को automate करेगा, 3.9 करोड़ positions पर असर होगा", लेकिन अभी अमेरिका में labor value automation की संभावना 2.27% है। अमेरिका का GDP अभी 27 ट्रिलियन डॉलर है, तो 61 बिलियन डॉलर के labor value को optimize करके अमेरिकी workforce के लगभग 15% को replace किया जाएगा और 2.3 ट्रिलियन डॉलर की value पैदा होगी—यह गणना सच में सही है या नहीं, इस पर शक है। यह सब खरीदेगा कौन (अगर workers नहीं, तो कौन?) यह भी सवाल है। 2025 का AI investment पहले ही उसका आधा पार कर चुका है। इस स्थिति में "labor value" को कैसे मापा जाए, यह समझ नहीं आता। GDP शायद सही metric नहीं है।
    • मुझे भी report से यही impression मिला। कुछ news outlets सिर्फ clicks के लिए सनसनीखेज narrative को आगे बढ़ा रहे हैं। वे असली report को गंभीर रूप से गलत समझ रहे हैं। यह AI की विफलता नहीं है; बड़ी वजह यह है कि मौजूदा कर्मचारी tools को ठीक से adopt नहीं कर रहे, या कम-से-कम कंपनी द्वारा दिए गए tools को नहीं अपना रहे। उन्होंने जिस "shadow AI economy" का ज़िक्र किया, वह भी एक वास्तविक समस्या है। लोग कंपनी के tools की बजाय personal subscription वाले LLMs इस्तेमाल कर रहे हैं। हमारे विश्वविद्यालय ने भी सभी students और staff को ChatGPT Enterprise दिया है, लेकिन यह cloud-based latest versions (जैसे GPT-5) की तुलना में काफी कमजोर है। इसलिए system adoption और user retention कम है। ज़्यादातर use cases में cloud का उपयोग ऐसे data के साथ होता है जो illegal नहीं है, इसलिए constraints भी ज़्यादा नहीं हैं।
    • report का यह हिस्सा खास तौर पर प्रभावशाली लगा: एक mid-sized law firm के वकील ने कंपनी से 50,000 डॉलर का contract analysis tool खरीदा, लेकिन असली काम में फिर भी ChatGPT का इस्तेमाल करता है। कंपनी का खरीदा हुआ AI tool बहुत rigid summaries देता है और customize करना मुश्किल है, जबकि ChatGPT में बातचीत को steer करके मनचाहा output बार-बार निकाला जा सकता है। यानी 20 डॉलर का tool करोड़ों रुपये के enterprise solution से user satisfaction के लिहाज़ से कहीं बेहतर है। इसी वजह से कई कंपनियाँ GenAI divide के गलत पक्ष पर खड़ी हो जाती हैं।
    • 3.9 करोड़ positions पर असर का दावा सच में चौंकाने वाला है। अमेरिका की working population 16.3 करोड़ है, यानी लगभग एक-चौथाई जोखिम में है।
    • "बहुत से लोग जल्दी में यह निष्कर्ष निकाल रहे हैं कि AI काम नहीं करता" वाली टिप्पणी के जवाब में मशहूर कथन साझा किया गया: "अगर किसी व्यक्ति की तनख्वाह किसी चीज़ को न समझने पर निर्भर करती है, तो वह उसे समझने की कोशिश नहीं करेगा।"
  • मैं इस समय AI engineering team lead हूँ, इसलिए स्वाभाविक है कि AI value create करता है—यह मेरी समझ से मेल खाता है। हमारी कंपनी में AI adoption से लाखों डॉलर की बचत हुई है। हम एक बड़ा call center चलाते हैं, और पहले कर्मचारी हर call के बाद 3-5 मिनट लगाकर manually summary लिखते थे। हाल ही में हमने AI से call summaries automate की हैं। summary की quality भी बेहतर हुई है और लोगों को ज़्यादा value वाले काम पर focus करने का समय मिला है। यह revolutionary नहीं है, लेकिन व्यावहारिक और मापने योग्य efficiency gain है।
    • एक छोटा सुझाव: summaries को पहले से लिखने के बजाय सिर्फ ज़रूरत पड़ने पर generate करने का सुझाव। call audio को 24Kb/s Opus में store करें, तो 1 मिनट पर 180KB लगेगा, और एक निश्चित अवधि बाद delete करने की process रखकर सालाना लाखों डॉलर की अतिरिक्त बचत हो सकती है।
    • हमारी कंपनी Google Meet और Gemini से meetings की transcripts बनाती है। लेकिन असली content बहुत inaccurate होता है। किसने क्या कहा, यह गड़बड़ा जाता है, कभी-कभी अर्थ उलट जाता है। context नहीं होता, और हमारे internal terminology को भी नहीं समझ पाता, इसलिए असल में इस्तेमाल लायक नहीं है।
    • मुझे जिज्ञासा है कि क्या call center कर्मचारी सच में महसूस करते हैं कि AI summaries उनसे बेहतर हैं। मेरे अनुभव में meeting summaries के लिए यह मुश्किल होगा। लगता है यह one-way calls में ही ज़्यादा अच्छा काम करता है।
    • हमने भी meeting summaries के लिए AI आज़माया, लेकिन नतीजे इतने कमजोर थे कि फिर से humans को ही लिखना पड़ा। अगर कोई खास use case, training, या customization असरदार रहा हो तो जानना चाहूँगा।
    • यह भी सवाल है कि call center कर्मचारियों को हर call पर 3-5 मिनट देकर summary लिखने की ज़रूरत ही क्यों थी। कई AI use cases में देखा है कि असल में बेकार काम को automate किया जा रहा होता है। अगर report कोई पढ़ता ही नहीं, तो summary quality मायने नहीं रखती; AI गलत भी लिखे तो फर्क नहीं पड़ता। operational efficiency में असली बात बेकार process को automate करना नहीं, हटाना है। अंततः AI अक्सर संगठन के wasteful work को ढँकने का काम कर रहा लगता है। अगर ऐसी optimization नहीं हो सकती, तभी शायद इसकी ज़रूरत पड़े।
  • अभी हम "Trough of disillusionment" में प्रवेश कर रहे हैं। ऐसे hype cycles अनुमानित होते हैं। GPT-5 को भारी उम्मीदों के बाद निराशाजनक कहा जा रहा है, इसलिए यह GenAI के "अब खत्म" चरण की शुरुआत हो सकती है। जैसे ही ROI पूछा जाता है, हकीकत सामने आने लगती है। जो लोग चतुर हैं वे अगली disruption की तैयारी में लग चुके हैं, और कुछ लोग अभी भी इस घाटी की तलहटी तक जाएँगे। धीरे-धीरे और भी बेताब PR यह कहता हुआ दिखेगा कि "वास्तव में value है।"
    • अगर पता चले कि ज़्यादातर कंपनियों ने यह जानते हुए भी कि पैसा बर्बाद हो रहा है, सिर्फ stock price के कारण invest किया, तो मुझे हैरानी नहीं होगी।
    • Gemini हर update के साथ काफी अच्छा impression देता है, लेकिन हाल की improvements की speed और quality दोनों में काफी slowdown है। यह किसी दीवार के पास पहुँचने का संकेत लगता है। stagnation के बाद फिर jump आने वाले pattern में LLMs का भविष्य computer vision की तुलना में बेहतर लग सकता है।
    • Sam Altman ने GPT-5 की performance को ज़रूरत से ज़्यादा hype किया। user के नज़रिए से GPT-4 की तुलना में कोई बहुत बड़ा leap महसूस नहीं होता। लेकिन trainable dynamic router approach ने inference cost काफी घटाई है, जो महत्वपूर्ण है। यह innovation users से ज़्यादा OpenAI और power grid के लिए फायदेमंद है।
    • जब OpenAI GPT-3.5-Turbo से GPT-4 पर गया था, वह revolutionary बदलाव था और दूसरे models भी नहीं थे। लेकिन GPT-5 आने से पहले ही o series, Llama, DeepSeek, Gemini जैसे ढेर सारे models आ चुके थे। आगे GPT-3.5 से 4 जैसा jump फिर नहीं दिखेगा। GPT-5 कई models को एक में unify करता है, लेकिन उसके पास "first" होने का title नहीं है।
    • क्या इसी वजह से Windsurf team ने जल्दी exit लिया और बेचकर निकल गई, यह सोचने वाली बात है।
  • सवाल पूछा गया कि ऐसे कौन से व्यावहारिक AI use cases हैं जो सच में revenue बढ़ाते हैं या cost घटाते हैं। 1. online content generation (पहले से over-saturated) 2. junior developers को replace करना (productivity gain सीमित) 3. customer service staff को replace करना (cost saving है, revenue पर असर कम) 4. assistive tools (writing, analysis आदि, पर सीमाएँ हैं) 5. video games/robot characters जैसी next-gen interactions 6. AI virtual companions और NSFW, यह market कुछ समय तक profit दे सकती है। पूछा गया कि क्या इससे ज़्यादा यथार्थवादी examples हैं।
    • मैं LLM का उपयोग semi-structured documents से specific information extract करके automatic classification/filing वाले project में कर रहा हूँ, accuracy 95% से ऊपर है और अभी fine-tuning भी नहीं की। अंत में manual approval होगा, लेकिन फिर भी सालाना सैकड़ों घंटे बच रहे हैं। information extraction और classification में AI बहुत प्रभावी है।
    • healthcare में clinical notes, data, imaging interpretation—यानी हर record सीधे revenue से जुड़ा होता है। हर साल इस प्रशासनिक हिस्से पर अरबों डॉलर खर्च होते हैं। अगर GenAI notes की quality/accuracy को काफी बेहतर कर दे, तो सीधे revenue बढ़ सकता है। insurance में भी यही बात लागू होती है, जहाँ बहुत सारा paperwork और verification चाहिए। अंत में शायद AI systems ही एक-दूसरे को documents भेजेंगे और इंसान pool के किनारे बैठे होंगे।
    • AI customer service, user के नज़रिए से, बहुत चिढ़ाने वाला अनुभव है।
    • अगर 200 डॉलर प्रति माह में productivity 50% बढ़ती है, तो यह बहुत बड़ी value है। ज़्यादातर देशों की annual productivity growth 0-2% होती है।
    • अच्छा होगा अगर कंपनी के internal documents/wiki/codebase को RAG से जोड़कर onboarding और information search आसान करने वाला AI हो। इंसानों को replace करने से बेहतर है कि काम करना आसान बनाया जाए।
  • लोग जो सबसे बड़ी गलती करते हैं, वह यह है कि AI को service नहीं बल्कि feature के रूप में देखना चाहिए। कोई यह नहीं सोचता कि "आज मैं AI से बात करना चाहता हूँ!" users बस अपना काम बिना बोरियत या भारीपन के पूरा करना चाहते हैं। ऐसे में AI का चुपचाप मदद करना सही है। लेकिन हम feature नहीं, service (=product) बेचते हैं, इसलिए marketing में AI को सामने रखना पड़ता है। Notion/Slack/Airtable सभी AI को headline बनाकर बेच रहे हैं, जबकि असल चीज़ AI नहीं, बल्कि वह काम है जिसमें वह मदद करता है।
    • मैं तो यह भी नहीं कहूँगा कि AI एक feature है; AI अंततः technology है। इच्छा यह नहीं होती कि "काश इस product में AI होता", बल्कि यह कि "काश मैं यह काम कर पाता"। अगर product मेरा काम हल कर दे, तो कैसे किया यह मायने नहीं रखता। बहुत सी कंपनियाँ AI को बस ऊपर से चिपकाना चाहती हैं, लेकिन user की वास्तविक समस्या पर focus नहीं करतीं।
    • बात सही है, लेकिन वास्तविकता में ऐसा होने पर market की high valuations और overheated mood खत्म हो जाएगी। जब यह जागरूकता का पल आएगा, तो बाकी बचे "hot" software sectors भी ठंडे पड़ जाएँगे और industry को यह मानना पड़ेगा कि market अब 5-10 साल पहले जैसा नहीं रहा।
    • अच्छा होगा अगर AI को सिर्फ एक और tool की तरह पेश किया जाए। "यह use case मौजूद है" जैसी एक बार की notification काफी है। लेकिन हकीकत में हर UI AI logos, autocomplete आदि से भरा पड़ा है, जो ध्यान भंग करता है। लगता है tool नहीं, वही main character बन गया है। असल में users को उनकी ज़रूरत के अनुसार इस्तेमाल करने के लिए सिर्फ guide करना चाहिए, लेकिन कंपनियाँ बहुत ज़बरदस्ती ठूँस रही हैं। इन्हें थोड़ा रुककर users पर भरोसा करना सीखना चाहिए।
    • पूरी तरह सहमत हूँ, आखिरकार मायने product की अपनी value का है; उसके नीचे क्या इस्तेमाल हुआ, यह नहीं।
    • आजकल AI-enabled applications लगभग "problem ढूँढते हुए solution" जैसी लगती हैं।
  • report PDF link landing page पर redirect हो रहा है, और CTA कहता है "अपने AI product को जल्दी सफल बनाइए", इसलिए यह objective report से ज़्यादा साधारण content marketing जैसा लगता है। लेखक के नाम पर क्लिक किया, वहाँ भी कुछ नहीं था। न site पर भरोसा हुआ, न लेखक पर। HN भी अब Reddit जैसा होता जा रहा है—लोग सिर्फ title देखकर आते हैं और सहमति/असहमति में comment डालकर चले जाते हैं।
  • सोचता हूँ अगर लोग सच में पूरी report खुद पढ़ें तो क्या समझें: https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf केवल 40% कंपनियों के पास official LLM subscription है, लेकिन 90% से अधिक कंपनियों के कर्मचारी रोज़मर्रा के काम में personal AI tools इस्तेमाल करते हैं। असल में लगभग हर employee किसी-न-किसी रूप में LLM इस्तेमाल कर रहा है। "shadow AI" users तब भी दिन में कई बार LLMs का उपयोग कर रहे हैं जब कंपनी के official projects pilot stage में अटके हुए हैं। यानी enterprise के official AI initiatives fail हो रहे हैं, लेकिन कंपनी के अंदर LLM usage वास्तव में फैल रहा है—यह एक विडंबनापूर्ण स्थिति है। यह कहानी लेख की तरह कोई नया धमाकेदार खुलासा नहीं, बल्कि शायद पूरी तरह अलग कहानी है।
  • लगता है अमेरिका हर तकनीकी innovation में हमेशा ऐसे ही आगे निकल जाता है। बहुत पैसा खर्च करता है, नुकसान भी झेलता है, लेकिन risk भी लेता है, और अंत में इतना आगे निकल जाता है कि पकड़ना मुश्किल हो जाता है। AI/अमेरिकी कंपनियों के खिलाफ बहुत जल्दी जीत की घोषणा करना खतरनाक है।
    • मुझे नहीं लगता कि यह सामान्यीकरण सही है कि अमेरिका हर क्षेत्र में आगे है। finance जैसे कई क्षेत्रों में वह दूसरे देशों से पीछे है। China EVs और solar में आगे है। software के मामले में बात सही हो सकती है, लेकिन अमेरिका की रक्षा-रेखा monopolies, lock-in, और अमीरों के पक्ष में बने regulations से भी बनती है।
    • यह सोच बहुत ज़्यादा सरल है और वास्तविकता को उल्टा विकृत कर सकती है।
    • solar, EV, drones जैसे उदाहरण देकर कहा गया कि अमेरिका को हर हाल में आगे मानना ठीक नहीं।
    • GSM के इतिहास का ज़िक्र करते हुए भी कहा गया कि innovation की अगुवाई हमेशा अमेरिका ने नहीं की।
  • यह बात दिलचस्प है कि अपनी productivity के बारे में self-assessment वास्तविकता से अलग हो सकती है। METR के अध्ययन में developers को लगा कि AI की वजह से वे 20% तेज़ हुए, लेकिन वास्तव में वे 19% धीमे हो गए। https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
    • ऐसे studies से भी पकड़ना मुश्किल कई nuances होते हैं। किस तरह का AI इस्तेमाल हो रहा है, कौन से tools हैं, familiarity कितनी है, development process क्या है, team size क्या है, और user का seniority level या detail-orientation कैसा है—इन सबका असर पड़ता है। अभी investors market share लेने के लिए AI pricing को भारी subsidy दे रहे हैं, लेकिन वह phase खत्म होने के बाद prices और भी नीचे जा सकते हैं। मुझे लगता है कि AI की प्रगति से मैं पहले ही काफी लाभ पा चुका हूँ; आगे शायद focus gradual improvements और बेहतर user experience पर होगा। अभी AI कंपनियों में invest करने का इरादा नहीं है।
    • कभी-कभी AI ऐसा लगता है जैसे autocomplete की तरह मेरे विचार बिल्कुल पढ़ लेता हो, लेकिन कभी वह इतनी बेतुकी सलाह देता है कि सिर्फ बाधा बनता है।
    • यह भी सवाल है कि कहीं AI इंसानों को सिर्फ सूक्ष्म स्तर के सुधारों ("in the weeds") में फँसाकर बड़ी तस्वीर से दूर तो नहीं कर रहा। development speed का फैसला अक्सर व्यापक strategic judgment से होता है—जैसे क्या मुझे यह tool इस्तेमाल करना चाहिए, क्या यह feature सच में ज़रूरी है, वगैरह।
    • sample size छोटा है, फिर भी यह anecdote या self-reported data की तुलना में कहीं ज़्यादा अर्थपूर्ण अध्ययन है।