• एजेंट-आधारित coding tool Claude Code, सिर्फ कोड लिखने से ज्यादा, प्रोडक्ट बनाने और workflow को फिर से गढ़ने में बड़ा बदलाव ला रहा है
  • Microsoft के work AI users सर्वे में तेज AI adoption का दबाव, नए outputs का निर्माण, और अधिक मूल्यवान काम पर बढ़ा समय—ये सब साथ दिखे, लेकिन AI experimentation के rewards अभी भी बहुत कम हैं
  • जब संगठन सिर्फ usage को लक्ष्य बनाते हैं, तो token leaderboard और usage inflate करने जैसी प्रवृत्तियाँ पैदा होती हैं; AI से मूल्य जोड़ने के तरीके से जुड़े metrics ज्यादा महत्वपूर्ण हैं
  • Boris Cherny का मानना है कि engineer की पदवी builder जैसे role में बदल सकती है; non-engineers भी code बनाएँगे, और engineers direct typing से ज्यादा judgment, planning और user understanding पर ध्यान देंगे
  • AI से productivity बढ़ने का मतलब सिर्फ labor hours या jobs में कमी नहीं है; कंपनियाँ workflows को AI-केंद्रित रूप में फिर से बनाएँगी और व्यक्तियों के पास बड़ी choice और leverage होगा

AI कार्य डेटा और संगठनात्मक metrics के जाल

  • Microsoft ने वास्तविक काम में AI इस्तेमाल करने वाले 20,000 users का सर्वे किया, और एक घटना दिखी जिसे वह "transformation paradox" कहता है
    • 65% को चिंता है कि अगर वे AI को जल्दी adopt नहीं करेंगे तो पीछे रह जाएँगे
    • 58% AI की मदद से अब ऐसे outputs बना रहे हैं जिन्हें वे एक साल पहले नहीं बना सकते थे
    • 66% ने कहा कि AI की वजह से वे अधिक मूल्यवान काम पर समय दे पा रहे हैं
    • लेकिन AI experimentation के लिए workplace में reward मिलने की बात सिर्फ 13% ने कही, यानी इस्तेमाल की इच्छा और संगठन के बीच अंतर मौजूद है
  • Microsoft के एक अलग शोध में पाया गया कि अगर managers खुद AI usage दिखाएँ तो usage 17% बढ़ता है, और agent trust 30% बढ़ती है
    • "AI ही भविष्य है" जैसे नारों से अधिक असर तब होता है जब managers खुद वास्तव में कैसे इस्तेमाल करते हैं यह ठोस रूप में दिखाते हैं
    • अगर employees को लगे कि AI से बढ़ी productivity का लाभ वे भी साझा कर सकते हैं, तो usage motivation बदल सकती है, लेकिन ऐसा financial reward देने वाली जगहें लगभग नहीं हैं
  • कुछ workplaces token cost को subsidize करते हैं, लेकिन वह support हमेशा अच्छे नतीजे नहीं देती

Token maxing — usage metrics के side effects

  • बड़ी tech कंपनियों में token maxing यानी usage बढ़ाने के लिए जरूरत से ज्यादा tokens खर्च करने की घटना सामने आ रही है
    • Financial Times से Amazon employees ने कहा कि Amazon ने OpenClaw से प्रेरित internal tool mesh claw अपनाया और उसके usage को बढ़ावा दिया
    • टीम के भीतर token usage ranking board होने से कुछ employees बिना उत्पादकता वाले agents को बेवजह चलाकर usage बढ़ाते हैं
    • Meta में अधिकतम usage सैकड़ों अरब tokens तक पहुँचा, और लाखों डॉलर की लागत के बराबर मात्रा लगभग बेकार गई
  • Amazon का आधिकारिक रुख है कि token usage manager evaluation metric नहीं है, लेकिन employees मानते हैं कि managers इसे देखते हैं, इसलिए raw usage बढ़ाया जाता है
    • Amazon में ऊपर से यह लक्ष्य है कि 80% developers हर हफ्ते AI का इस्तेमाल करें
    • अगर ठोस reward न हो, तो लोग सिर्फ "AI इस्तेमाल करो" वाले वाक्य का पालन करते हैं और "काम बेहतर करो" वाले मूल उद्देश्य को खो देते हैं
    • developers के लिए अस्पष्ट tracking से अधिक, value creation से जुड़े productive metrics साफ-साफ चाहिए

Claude Code की उत्पत्ति और तेज विस्तार

  • Claude Code, Anthropic का पिछले साल मई में लॉन्च किया गया एजेंट-आधारित coding tool है, जिसमें शब्द लिखो और वह code दे दे
    • लॉन्च के 8 महीने के भीतर GitHub पर चढ़े कुल code का लगभग 4% इसके जरिए बना
    • उसी साल फरवरी में यह $2.5 billion annual revenue run rate तक पहुँचा, और इस स्तर तक पहुँचने वाला सबसे तेज enterprise product बना
    • इसके निर्माता Boris Cherny ने computer science degree नहीं ली; उन्होंने economics पढ़ी, 18 साल की उम्र में college छोड़ा, startup चलाया, hedge fund में काम किया, फिर Meta में principal engineer के रूप में 5 साल काम करने के बाद 2024 के अंत में शामिल हुए
    • अभी Cherny खुद code की एक भी line सीधे नहीं लिखते, बल्कि 5 terminal tabs में 5 agents parallel चलाकर रोज 20~30 pull requests संभालते हैं
  • coding tool बनाने का assignment नहीं था; API सीखते-सीखते यह side project के रूप में शुरू हुआ
    • शुरुआती रूप में Claude को AppleScript से जोड़कर वह सिर्फ सुना जा रहा music दिखाता था
    • दो महीने के भीतर Claude Code version आ गया, और पहले ही दिन Anthropic engineering team के 20% ने इसका इस्तेमाल किया
  • वह 2024 के सितंबर में शामिल हुए और एक बहुत छोटी labs team में थे
    • इसी टीम ने Claude Code, MCP, skills, और desktop app बनाया, और इसमें कई experimental ideas थे जिनकी सफलता का पता नहीं था
    • Anthropic enterprise, coding और safety पर फोकस कर रहा था, और अगर product बनाना हो तो ऐसा coding product बनाना समझदारी थी जो बेहतर coding model और safety research दोनों में मदद करे
  • उस समय ज़्यादातर coding products IDE extensions थे, और Sonnet 3.5 स्तर पर वे advanced autocomplete के करीब थे
    • उन्हें model overhang महसूस हुआ—यानी model बहुत कुछ कर सकता था, लेकिन उसकी क्षमता निकालने वाला product नहीं था; यह एहसास आज भी वही है
    • अलग UI या app के बिना terminal में चलने वाला सबसे सस्ता रूप कुछ ही दिनों में बना लिया गया
    • आस-पास से users फैलते गए, कुछ ही हफ्तों में कंपनी के भीतर बड़ी संख्या में लोग इसे रोज इस्तेमाल करने लगे, और लॉन्च के 5 दिनों में engineering team का आधा हिस्सा इसका user बन गया
    • terminal से हिचकने वाले engineers भी इसे इस्तेमाल करने लगे, और Cherny ने "software engineering हमेशा के लिए बदल गई" जैसी बातों का विश्लेषण करने के बजाय सिर्फ launch पर ध्यान दिया

क्या engineers गायब हो जाएँगे — roles का मिश्रण

  • पहला झटका तब लगा जब Claude ने चल रहा music बता दिया
    • सवाल के जवाब में Claude ने music player खोलने वाला AppleScript code लिखा; Cherny उस भाषा को नहीं जानते थे और ऐसा जवाब देने के बारे में सोच भी नहीं सकते थे
    • इसने समस्या को उस तरीके से हल किया जो engineer शायद न चुनता
  • models बहुत तेजी से बेहतर हो रहे हैं, इसलिए model के ऊपर product बनाते समय हर महीने recalibration चाहिए
    • Co-work से 8 flights और 5 hotels बुक किए गए; एकमात्र गलती लगभग $5,000 per night वाले hotel की booking थी, इसलिए सिर्फ वही दोबारा बुक करना पड़ा
  • रुझान exponential curve जैसा है, इसलिए कोई ठीक-ठीक नहीं जानता; दो बातें एक साथ हो रही हैं
    • कुछ कंपनियों को engineer productivity बढ़ने से उसी काम के लिए कम engineers चाहिए
    • कुछ कंपनियों को प्रति व्यक्ति productivity बढ़ने से ज्यादा products और businesses बनाने हैं, इसलिए और ज्यादा engineers चाहिए (Cherny की team अभी भी अच्छे engineers की कमी से जूझ रही है और जितनी तेजी से हो सके hiring कर रही है)
  • roles दिलचस्प ढंग से मिल रहे हैं
    • manager Fiona ने 15 साल coding नहीं की थी, लेकिन जुड़ने के बाद coding की; product manager Cat और designer Megan समेत टीम का हर सदस्य coding कर रहा है
    • non-engineers थोड़ा ज्यादा code लिख रहे हैं, और Cherny जैसे engineers 6 महीने से अधिक समय से खुद code नहीं लिखते हुए भी दिन भर चीजें बना रहे हैं
    • इसे builder, engineer, product manager में से क्या कहा जाएगा यह साफ नहीं, लेकिन role का बदलना साफ दिख रहा है

Tractor analogy — technology diffusion का समय

  • tractor 1890s में Iowa में John Frick ने बनाया, लेकिन अमेरिका में tractors की संख्या horses से ज्यादा होने में 1960s तक करीब 70 साल लग गए
    • tractors ने yield और productivity बहुत बढ़ाई, लेकिन उन्हें चलाने के लिए training चाहिए थी, और शुरुआत में वे इतने महंगे थे कि horse सस्ता पड़ता था
    • performance भी सीमित थी; जैसे wheat में चल जाए, corn में नहीं, और अलग-अलग crops के हिसाब से ढलने में लंबा समय लगा
    • अभी AI transition में वही समस्याएँ speedrun की तरह हो रही हैं
  • यह AI as normal technology वाले दृष्टिकोण से जुड़ता है—बहुत सक्षम model आ जाने पर भी लोगों और संगठनों का बदलाव धीमा रहता है
    • लेकिन Anthropic के revenue trend को देखें तो इस बार गति तेज होने का प्रतिवाद भी मौजूद है, इसलिए वास्तविक बदलाव की रफ्तार अभी आँकी जा रही है
  • computers productivity बढ़ाते हैं, लेकिन इसका मतलब यह नहीं कि काम के घंटे घटेंगे — बल्कि उसी समय में ज्यादा काम होगा

क्या coding "solve" हो चुकी है?

  • "coding is solved" एक ऐसी बात है जो "मैं जिस तरह की coding करता हूँ" तक सीमित है
    • Cherny का काम—cloud CLI, desktop app, mobile app—तुलनात्मक रूप से नए और सरल codebases पर है
    • लेकिन NASA जैसे बड़े ग्राहकों के विशाल और जटिल codebases में यह अभी solve नहीं हुआ है, और models अब भी perfect नहीं हैं तथा गलतियाँ करते हैं
  • engineers की यह आपत्ति सही है कि coding सिर्फ typing नहीं बल्कि judgment, taste, critical thinking है, और agents इसमें अभी कमजोर हैं
    • Cherny के पुराने दिन का भी लगभग 50% ही असली code typing होता था; बाकी user conversations, brainstorming, debugging, design और planning में जाता था
    • अगर model coding संभाल ले, तो engineer user से बात करने और आगे क्या बनाना है यह सोचने जैसे ज्यादा आनंददायक काम के लिए मुक्त हो सकता है
  • Claude Code पिछले 6 महीने से 100% Claude Code से लिखा जा रहा है, और Co-work जैसे दूसरे products भी ऐसे ही हैं
    • हाल की Y Combinator batch conversation में "100% code Claude Code से लिखा" कहने पर सैकड़ों में लगभग आधों ने हाथ उठाया; "model से बिल्कुल नहीं लिखते" पर सिर्फ एक व्यक्ति, बाकी 50~100% के बीच थे
    • उनका मानना है कि engineering में बदलाव, engineering के बाहर बाकी सभी क्षेत्रों का leading indicator है
  • skill atrophy की चिंता और programming का बदलाव

    • यह चिंता उठती है कि अगर सीधे code न लिखा जाए तो अपने पेशे की समझ कमजोर पड़ सकती है
      • टीम की engineer Lena मज़े के लिए हर weekend हाथ से C++ लिखती हैं, और ऐसी जगह हमेशा रहेगी
      • Cherny इसे skill atrophy नहीं, बल्कि programming के हमेशा बदलते प्रवाह के रूप में देखते हैं
        • सोवियत दौर के punch cards, Apollo program के समय कागज पर manual calculations भी उस समय "programming" थे
        • बाद में machine code → assembly → JavaScript·Python आया, और अब बदलाव agents से बात करके programming करने की ओर है, फिर जल्दी ही agents का agents से बात करके coding करना अगला चरण हो सकता है
      • यह वैसा है जैसे calculator आने से कुछ math skills घटें, फिर भी लोग calculator इस्तेमाल करते हैं; हालांकि जब वह tool superintelligence बनकर चुपचाप user को कमजोर करे, तो वह अलग समस्या है
  • model performance regression विवाद

    • हर नए model launch के बाद समय-समय पर यह प्रतिक्रिया आती है कि "performance बहुत regress कर गई"
      • वास्तव में bug की वजह से 2 मामले हुए थे, और Anthropic ने कारण और fixes को blog में सार्वजनिक किया
      • बाकी ज़्यादातर मामलों में यह honeymoon period जैसा हो सकता है, जहाँ model की आदत पड़ते ही शुरुआती चमत्कार का एहसास कम हो जाता है
    • एक साल पहले के विपरीत, अब model का code Cherny के खुद लिखे code से बेहतर है
      • पहले हर line को तीन बार review करना पड़ता था, लेकिन अब वे Claude को काम सौंपते हैं, फिर उससे नतीजों को दोबारा check और test करवाते हैं, और साथ ही 15 Claude parallel चलाते हैं

productivity paradox और विकल्पों का विस्तार

  • productivity बढ़ने पर भी काम के घंटे कम न होना काफी हद तक व्यक्ति की पसंद और कंपनी की स्थिति पर निर्भर है
  • यह बात washing machine की कहानी से समझाई गई
    • washing machine से पहले एक बार कपड़े धोने में 5~6 घंटे लगते थे और लगभग 3,000ft चलना पड़ता था; आग जलाना, पानी उबालना, washboard पर रगड़ना, निचोड़ना—ये सब परिवार के सदस्यों की संख्या के हिसाब से रोज दोहराना पड़ता था
    • washing machine ने एक बार की laundry में लगभग 3 घंटे बचाए
    • यह महिलाओं के बड़े पैमाने पर labor market में प्रवेश को संभव बनाने वाले कारकों में से एक था
    • बचा हुआ समय बच्चों के साथ बिताना, टहलना, पढ़ना, दोस्तों से मिलना, या factory/office jobs में जाना—ऐसे व्यक्तिगत विकल्प देता है; AI भी इसी तरह विकल्प बढ़ाता है
  • CS degree पूरी कर चुके 22 वर्षीय व्यक्ति के लिए सलाह: entry-level jobs अभी भी हैं, लेकिन अगर थोड़ा भी founder mindset है तो startup शुरू करने की सलाह है
    • यह इतिहास का startup बनाने का सबसे अच्छा golden age है, जहाँ "आप और आपके agents" मिलकर एक बहुत बड़ी कंपनी बना सकते हैं
    • वास्तव में 1~3 लोग billion-dollar companies और बेहतरीन startups बना रहे हैं, और एक व्यक्ति का leverage बहुत बड़ा हो गया है
  • 3 साल बाद शायद उन्हें "engineer" न कहा जाए, लेकिन code लिखने या agents से code बनवाने वाले लोग आज से 100 गुना हो सकते हैं

Claude Co-work — non-engineers के लिए विस्तार

  • Co-work की शुरुआत तब हुई जब लोगों को tax filing करने के लिए terminal में Claude Code install करते देखा गया, यानी वे इसे coding के अलावा भी इस्तेमाल कर रहे थे
    • accounting, finance, legal से लेकर flights booking, concert tickets खरीदने, और Washington state के clam digging permit खरीदने तक, यह कई non-engineering कामों में इस्तेमाल हो रहा है
    • coding products ऐसे बने थे कि engineers ने खुद के लिए कुछ बनाया और वह दूसरों के भी काम आया, लेकिन Co-work एक नई चुनौती है जो पूरे non-engineer वर्ग के लिए बनाया जा रहा है
  • लंबे समय तक चलने की क्षमता इसका मुख्य direction है
    • लगभग डेढ़ साल पहले model limits के कारण Claude Code 30 seconds बाद ही track से हट जाता था, इसलिए बीच में हस्तक्षेप करना पड़ता था
    • अब हर रात सैकड़ों से हजारों agents 5, 10, 20 घंटे तक चलते हैं, और यही आज का engineering style है
    • Co-work भी इसी दिशा में जाएगा, लेकिन किस तरह के काम में इतनी लंबी runtime चाहिए, यह अभी साफ नहीं है
  • memory और user understanding बेहतर होने पर यह ज़रूरत को पहले से भाँपने की दिशा में बढ़ेगा
    • उदाहरण: बचे हुए podcast episodes और अभी तक invite न किए गए guests को देखकर candidates पर brainstorming करना और शुरुआती contact email को drafts में रख देना
    • काम की परिभाषा "पूरा design" जैसी horizontal शैली और किसी खास लक्ष्य को अंत तक पूरा करने वाली vertical शैली में बँट सकती है
    • vertical उदाहरण: Claude किसी feature को बनाकर test, merge और launch तक कर दे
  • Opus 4.7 से Claude और proactive हुआ है
    • feature launch के 12 घंटे बाद user feedback check करने की reminder खुद schedule करना और bug हो तो उसे ठीक करने की कोशिश करना—ऐसी चीजें, जो इंसान अक्सर भूल जाते हैं, पहले से कर देने पर संतुष्टि ऊँची थी
  • Claude Mythos ज़्यादातर लोगों के लिए publicly available नहीं है; जो जानकारी बाहर आई है वह मुख्यतः coding और cybersecurity performance पर है—यह सामान्य jump से बड़ा leap है और cyber तथा coding में खास तौर पर मजबूत है

jobs displacement की जिम्मेदारी किसकी है

  • यह transition अच्छे और बुरे प्रभावों का मिश्रण होगा, और इसका सही समय व अनुपात अनुमानित नहीं किया जा सकता
    • Anthropic ऐसी विशिष्ट स्थिति में है जहाँ वह software engineers जैसी नौकरियों के loss का स्रोत बन सकता है
    • इसी कारण टीम के भीतर अक्सर यह मजबूत जिम्मेदारी महसूस की जाती है कि आने वाले बदलाव की चेतावनी दी जाए, tools का उपयोग सिखाया जाए, और लोगों को साथ लेकर चला जाए
  • यह एक कंपनी से हल होने वाली समस्या नहीं है, और न ही एक कंपनी द्वारा हल किया जाना वांछनीय है (वह गलत समाधान भी हो सकता है)
    • यह पूरे समाज के discussion और debate का विषय है, और Anthropic economic reports, policy discussions, और अपनी observations साझा करके योगदान दे रहा है
  • Anthropic safety lab होते हुए भी product बनाता है; एक कारण यह है कि लोग इसे सीधे अनुभव करके समझें और सामाजिक प्रतिक्रिया में भाग लें — अगर तकनीक को बंद कर दिया जाए, तो लोगों के लिए दृष्टिकोण बनाना कठिन हो जाता है

power users और AI gap

  • चिंता है कि digital divide अब AI divide में बदल सकती है, और अब तक का data दिखाता है कि AI का सबसे अच्छा लाभ उठाने वाले लोग अक्सर पहले से ही उच्च-आय वर्ग के करीब हैं
    • Anthropic के पास accessibility बढ़ाने वाले कुछ programs हैं, लेकिन उनके specific names या methods नहीं बताए गए
  • सबसे ज्यादा value पाने वाले users अक्सर अपेक्षा से अलग निकलते हैं
    • Opus 4.7 launch hackathon के winners आमतौर पर professional engineers नहीं थे, बल्कि electrician, doctor, carpenter जैसे लोगों ने apps बनाए; ठीक यही रुझान 4.6 hackathon में भी दिखा
    • models इतने refined हो गए हैं कि non-experts भी उन्हें अच्छी तरह चला सकते हैं
  • बड़े enterprises में adoption की कुंजी है work processes को बदलकर Claude को केंद्र में रखना
    • एक अच्छा तरीका यह है कि सबको tokens दिए जाएँ और safe experimentation करने दिया जाए, ताकि अनपेक्षित लोगों से ideas निकलें
    • सबसे अच्छे ideas senior engineer से नहीं, बल्कि किसी कोने में बैठे accountant या GTM person द्वारा बनाए internal dashboard से भी आ सकते हैं
    • आज जो व्यक्ति tool सबसे अच्छा इस्तेमाल कर रहा है, जरूरी नहीं कि कल भी वही सबसे अच्छा हो; इसलिए सबका tool usage सीखना महत्वपूर्ण है

अगले 1 साल का outlook

  • अगले साल काफी उलट-पुलट होगी, और बड़े players adapt करने की कोशिश करेंगे जिनमें से कई सफल भी होंगे
  • कुछ पारंपरिक business moats कमजोर होंगे और कुछ बने रहेंगे
    • network effects (जितने अधिक users, उतनी अधिक value) AI से अलग कारणों से कायम रहेंगे
    • economies of scale (marginal cost का गिरना) भी एक प्राकृतिक लाभ है, इसलिए खत्म नहीं होगा
    • लेकिन switching cost कमजोर होगी — अगर Claude vendor A से B में migration करा सके, तो वह अब बड़ा moat नहीं रहेगा
    • जो कंपनियाँ खत्म होते moat पर निर्भर हैं, उन्हें मुश्किल होगी; कई नई moats खोजेंगी
  • अपेक्षा से कहीं बड़ा innovation आएगा
    • नए ideas बड़े enterprises से नहीं, बल्कि 1, 2, 10 लोगों वाले छोटे startups से निकलेंगे, और उनकी संख्या विस्फोटक रूप से बढ़ेगी
    • materials discovery startup का उदाहरण: stone age, iron age से silicon age तक की कहानी में यह मानना कि अगर नया material मिले तो अगला युग शुरू हो सकता है, और Claude के जरिए possible molecules व designs तलाशे जा रहे हैं
    • जो काम पहले funding जुटाने में ही अटक जाता था, अब छोटी teams ऐसे breakthroughs ला सकती हैं जो 20 साल पहले असंभव थे
    • domain को अच्छी तरह जानने वाला व्यक्ति अगर "Claude की सेना" जुटा ले, तो वह human army की तुलना में बहुत ज्यादा कर सकता है
  • Cherny ने X और Threads पर user response को automate किया है, लेकिन उन्हें यह काम खुद करना पसंद है
    • Claude Code के loop को routine में बदलकर हर 30 मिनट पर चलाते हैं, और Threads API तथा X API से feedback इकट्ठा करते हैं
    • users के साथ सीधा interaction उनका पसंदीदा काम है, और "यह काम नहीं कर रहा" जैसी feedback भी product improvement का स्रोत है
    • Claude Code में कई कमियाँ हैं और यह ideal product से अभी दूर है, लेकिन feedback सुनकर हर दिन थोड़ा-थोड़ा सुधारना ही अच्छा product बनाने का एकमात्र तरीका है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.