• 2025 वह साल था जब agentic coding tools ने सचमुच प्रोग्रामिंग के तरीके को बदल दिया, और सीधे कीबोर्ड पर टाइप करने के बजाय लोग engineering lead की भूमिका में शिफ्ट होने लगे, जहाँ वे एक वर्चुअल इंटर्न प्रोग्रामर को दिशा देते हैं
  • Claude Code के प्रति जुनून से शुरुआत हुई, फिर अपने खुद के agents बनाना और दूसरों के agents का इस्तेमाल करना कई बार दोहराया गया, और इस प्रक्रिया में यह भरोसा मजबूत हुआ कि code generation, file system, programming tool calls, और skill-based learning अब भी सबसे बेहतर तरीका हैं
  • LLM और tool execution का मेल code generation से आगे बढ़कर रोज़मर्रा के काम व्यवस्थित करने तक पहुँच गया है, जिससे मशीनों के साथ हमारे रिश्ते पर फिर से सोचने और अनचाहे parasocial bond बनने की चिंता भी पैदा हुई है
  • मौजूदा version control systems और code review tools AI-generated code की समीक्षा के लिए उपयुक्त नहीं हैं, इसलिए ऐसे नए systems की ज़रूरत है जो prompt history और failure paths तक को ट्रैक कर सकें
  • AI coding की वजह से अनुभव और डेटा के बिना सिर्फ 'vibes' पर आधारित राय बहुत बढ़ गई है, और open source पर बिना सोचे-समझे भेजे जा रहे AI-generated PRs को लेकर एक नए social contract की ज़रूरत है

2025 में बदलाव

  • यह सिर्फ कंपनी छोड़कर नई कंपनी शुरू करने का साल नहीं था, बल्कि पुराने प्रोग्रामिंग तरीके को पूरी तरह बदल देने वाला साल भी था
  • जून से Cursor की जगह लगभग पूरी तरह hands-off तरीके से Claude Code का इस्तेमाल किया
    • "अगर 6 महीने पहले किसी ने कहा होता कि मैं एक वर्चुअल प्रोग्रामर इंटर्न का engineering lead बनना पसंद करूँगा, तो मैं उस पर यकीन नहीं करता"
  • 2007 के बाद से पूरे ब्लॉग की लगभग 18% पोस्ट्स के बराबर, कुल 36 पोस्ट लिखीं
    • agent rabbit hole में उतरने के बाद, जिज्ञासा के कारण प्रोग्रामरों, founders और अन्य लोगों के साथ लगभग 100 बातचीत की
  • 2025 दुनिया भर में एक बुरा साल भी रहा, इसलिए उन विचारों को अलग रखने के लिए एक अलग ब्लॉग(dark.ronacher.eu) बनाया

agents का साल

  • अप्रैल–मई में Claude Code के प्रति जुनून से शुरुआत हुई, और कई महीनों तक अपने agents बनाना और दूसरों के agents इस्तेमाल करना चलता रहा
  • सोशल मीडिया पर AI को लेकर तरह-तरह की राय फट पड़ी
  • अब स्थिति कुछ स्थिर हुई है: फोकस code generation, file system, interpreter glue के ज़रिए programmable tool calling, और skill-based learning पर है
    • Claude Code ने जिस तरीके को लोकप्रिय बनाया, वही अब भी state of the art लगता है, और foundation model providers का skills पर ध्यान इस विश्वास को और मजबूत करता है
  • TUI (text-based user interface) की ज़ोरदार वापसी चौंकाने वाली रही
    • अभी command line पर Amp, Claude Code, और Pi का इस्तेमाल हो रहा है
    • Amp, Apple या Porsche जैसा लगता है, Claude Code एक सस्ती Volkswagen जैसा, और Pi हैकरों की पसंद का open source विकल्प है
    • तीनों ऐसे प्रोजेक्ट लगते हैं जिन्हें उन लोगों ने बनाया है जो अपने ही प्रोडक्ट्स का हद से ज़्यादा इस्तेमाल करते हैं, लेकिन हर एक के अपने अलग trade-offs हैं
  • LLM और tool execution के मेल पर हैरानी अब भी बनी हुई है
    • साल की शुरुआत में इसका उपयोग मुख्य रूप से code generation के लिए था, लेकिन अब agents का रोज़मर्रा के कामों में भी खूब इस्तेमाल हो रहा है
    • 2026 में consumer products में दिलचस्प प्रगति देखने की उम्मीद है
    • LLM अब ज़िंदगी को व्यवस्थित करने में मदद कर रहे हैं, और उम्मीद है कि उनकी उपयोगिता और बढ़ेगी

मशीन और मैं

  • जब LLM सिर्फ प्रोग्रामिंग ही नहीं, दूसरे कामों में भी मदद करने लगे, तो मशीनों के साथ रिश्ते पर फिर से सोचना शुरू हुआ
  • tools के साथ parasocial bond न बनाना अब और मुश्किल होता जा रहा है, और यह अजीब भी लगता है और असहज भी
  • आज के ज़्यादातर agents के पास लगभग कोई memory नहीं है और personality भी बहुत कम है, लेकिन ऐसे agents खुद बनाना आसान है जिनमें ये बातें हों
    • memory वाले LLM को भुला पाना मुश्किल अनुभव है
  • 2 साल तक खुद को इस बात के लिए प्रशिक्षित किया कि इन models को सिर्फ token tumblers समझा जाए, लेकिन अब वह सरलीकृत नज़रिया काम नहीं करता
  • हम जो systems बना रहे हैं, उनमें मानवीय प्रवृत्तियाँ दिखती हैं, लेकिन उन्हें इंसानी स्तर तक उठा देना गलती होगी
  • "agent" शब्द से अब असहजता बढ़ रही है, लेकिन इससे बेहतर शब्द भी नहीं है
    • क्योंकि agency और responsibility इंसानों के पास ही रहनी चाहिए
    • यह जो भी बन रहा हो, अगर सावधानी न बरती जाए तो हानिकारक भावनात्मक प्रतिक्रियाएँ पैदा कर सकता है (chatbot psychosis देखें)
    • इन रचनाओं को हमारे साथ उनके रिश्ते में ठीक से नाम देना और जगह देना एक ऐसा काम है जिसे हल करना होगा
  • इस अनचाहे anthropomorphism की वजह से मशीनों के साथ काम करने के तरीके को बयान करने के लिए सही भाषा खोजना मुश्किल है
    • यह सिर्फ लेखक की समस्या नहीं है; दूसरे लोग भी यही महसूस करते हैं
    • और इससे उन लोगों के साथ काम करना और असहज हो जाता है जो अब भी इन systems को पूरी तरह नकारते हैं
    • agentic coding tools पर आने वाली सबसे आम टिप्पणियों में से एक मशीनों को personality देने के विचार के प्रति अस्वीकृति है

राय की बाढ़

  • AI का बहुत इस्तेमाल करने के बाद एक अनपेक्षित बात यह रही कि अब किसी भी चीज़ से ज़्यादा vibes की बात हो रही है
  • इस तरीके से काम करना अभी एक साल भी पुराना नहीं है, लेकिन यह आधी सदी के software engineering अनुभव को चुनौती दे रहा है
  • राय बहुत हैं, लेकिन यह कहना मुश्किल है कि समय की कसौटी पर कौन-सी टिकेंगी
  • बहुत-सी प्रचलित धारणाओं से असहमति है, लेकिन अपनी राय के समर्थन में ठोस आधार नहीं है
    • साल भर MCP की मुश्किलों के बारे में काफ़ी खुलकर बात की, लेकिन उसके पीछे "यह मेरे लिए काम नहीं करता" से ज़्यादा आधार नहीं था; दूसरी तरफ कुछ लोग इसे लगभग अंधविश्वास की तरह मानते हैं
    • model selection पर भी यही बात लागू होती है: Peter (जिन्होंने साल की शुरुआत में Claude की ओर धकेला) अब Codex पर जा चुके हैं और उससे खुश हैं; लेखक भी Codex ज़्यादा इस्तेमाल करने लगा है, लेकिन Claude जितना आनंद नहीं आता
    • Claude के प्रति पसंद का आधार vibes के अलावा कुछ नहीं है
  • यह समझना भी ज़रूरी है कि कुछ vibes जानबूझकर दिए गए signals के साथ आती हैं
    • ऑनलाइन दिखने वाले बहुत-से लोगों की एक प्रोडक्ट के पक्ष में दूसरी के मुकाबले वित्तीय दिलचस्पी होती है (वे investor हो सकते हैं या paid influencer)
    • हो सकता है वे प्रोडक्ट पसंद आने के कारण investor बने हों, लेकिन यह भी संभव है कि उस रिश्ते ने उनकी राय को प्रभावित और आकार दिया हो

outsourcing बनाम खुद बनाना

  • आज AI कंपनियों की libraries को देखकर अक्सर समझ में आ जाता है कि वे Stainless या Fern से बनाई गई हैं
    • documentation के लिए Mintlify और site authentication system के लिए Clerk इस्तेमाल हो सकता है
  • जिन services को पहले खुद बनाया जाता था, उन्हें specialist कंपनियों को outsource करने का चलन बढ़ा है, और इससे user experience के कुछ पहलुओं में मानक भी ऊँचे हुए हैं
  • लेकिन agentic coding tools की नई ताकत के साथ, इस काम का बड़ा हिस्सा फिर से खुद बनाया जा सकता है
    • Claude से Python और TypeScript के लिए एक SDK generator बनवाया गया — आधा जिज्ञासा से, आधा इसलिए कि यह काफ़ी आसान लगा
  • simple code और खुद बनाने के समर्थक के रूप में, इस बात को लेकर थोड़ी आशा है कि AI कम dependencies के ऊपर चीज़ें बनाने के लिए प्रोत्साहित कर सकता है
  • साथ ही, सब कुछ outsource करने की मौजूदा प्रवृत्ति को देखते हुए, यह साफ़ नहीं है कि दिशा सच में उधर जा रही है या नहीं

क्या सीखा और क्या उम्मीद है

  • अब आगे भविष्यवाणी नहीं, बल्कि उन जगहों की बात करनी है जहाँ अगली ऊर्जा लगाना अच्छा होगा
  • ठीक-ठीक क्या चाहिए, यह स्पष्ट नहीं है, लेकिन दर्द के बिंदुओं की ओर इशारा करना और संदर्भ व सोचने की सामग्री देना ज़रूरी है
  • version control का एक नया प्रकार

    • सबसे बड़ी अनपेक्षित खोज यह रही कि code sharing के लिए मौजूदा tools अपनी सीमा पर पहुँच चुके हैं
    • GitHub का pull request model AI-generated code की सही समीक्षा के लिए पर्याप्त जानकारी नहीं देता — अच्छा होता अगर बदलावों को दिशा देने वाले prompts भी देखे जा सकते
    • यह सिर्फ GitHub की समस्या नहीं है; git भी कम पड़ता है
    • agentic coding में models को आज कामयाब बनाने वाली चीज़ों में से एक है गलतियों को जानना
      • जब किसी पुराने state पर लौटते हैं, तो चाहत होती है कि tool को याद रहे कि क्या गलत हुआ था
      • बेहतर शब्द न होने पर भी, failure में value होती है
      • इंसानों के लिए भी यह जानना मददगार हो सकता है कि कौन-सा रास्ता कहीं नहीं ले गया, लेकिन मशीनों के लिए यह बहुत महत्वपूर्ण जानकारी है
      • conversation history को compress करने की कोशिश में यह सामने आया: गलत रास्ते हटा देने पर model वही गलती दोबारा करने लगता है
    • कुछ agentic coding tools worktree spin up करते हैं या git में restore के लिए checkpoints बनाते हैं, और conversation के अंदर branching तथा undo features देते हैं
    • ऐसे tools के साथ काम आसान बनाने के लिए UX innovation की काफी गुंजाइश है
      • इसी वजह से stacked diffs और Jujutsu जैसे alternative version control systems की चर्चा होती रहती है
    • यह GitHub को बदलेगा या नए competitors के लिए जगह बनाएगा, पता नहीं, लेकिन उम्मीद दूसरे विकल्प की है
    • इच्छा है कि मानवीय input को बेहतर तरीके से समझा जाए और उसे machine output से अलग किया जाए
    • prompts और असफल कोशिशें देखना चाहता हूँ
    • और फिर merge के समय सब कुछ squash हो जाए, लेकिन ज़रूरत पड़ने पर पूरी history खोजी जा सके, ऐसा तरीका चाहिए
  • review का एक नया प्रकार

    • यह version control से जुड़ा है: मौजूदा code review tools AI के लिए अनुपयुक्त सख्त role definitions थोपते हैं
    • GitHub code review UI का उदाहरण: अक्सर PR view पर comment का उपयोग करके अपने agent के लिए notes छोड़ना चाहता हूँ, लेकिन इसके लिए कोई guided तरीका नहीं है
      • review interface आपको अपने code की review करने नहीं देता, सिर्फ comment करने देता है, लेकिन दोनों की मंशा एक जैसी नहीं है
    • एक और समस्या यह है कि अब code review का बड़ा हिस्सा लोकल स्तर पर, मेरे और agent के बीच हो रहा है
      • उदाहरण के लिए GitHub का Codex code review feature एक समय में सिर्फ एक organization से bind हो सकता है, इसलिए वह काम करना बंद कर देता है
      • अब command line में Codex से review की जाती है, लेकिन इसका मतलब है कि iteration cycle का एक बड़ा हिस्सा टीम के बाकी engineers को दिखाई ही नहीं देता; यह टिकाऊ नहीं है
    • ऐसा लगता है कि code review, VCS का हिस्सा होना चाहिए
  • observability का एक नया रूप

    • observability फिर से गंभीर ध्यान पाने लायक है
    • अब इसे बिल्कुल नए स्तर पर उपयोग करने की ज़रूरत और अवसर दोनों पैदा हो गए हैं
    • ज़्यादातर लोग अपने eBPF programs खुद नहीं बना सकते थे, लेकिन LLM यह कर सकते हैं
    • कई observability tools जटिलता की वजह से SQL से बचते रहे, लेकिन LLM किसी भी proprietary query language से बेहतर SQL संभालते हैं
      • वे query लिख सकते हैं, grep कर सकते हैं, map-reduce कर सकते हैं, और LLDB को remotely control कर सकते हैं
      • जहाँ भी structure और text मौजूद हो, वह अचानक agentic coding tools की सफलता के लिए उपजाऊ ज़मीन बन जाता है
    • भविष्य की observability कैसी दिखेगी, यह नहीं पता, लेकिन इस क्षेत्र में बहुत innovation देखने का मजबूत अंदाज़ा है
      • मशीनों के लिए feedback loop जितना बेहतर होगा, नतीजे उतने बेहतर होंगे
    • लेखक को खुद भी ठीक-ठीक नहीं पता कि वह क्या माँग रहा है, लेकिन अतीत की एक समस्या यह रही कि बेहतर observability के लिए बहुत-से शानदार विचार — खासकर targeted filtering के लिए services की dynamic reconfiguration — इतने जटिल और कठिन थे कि user-friendly नहीं बन पाए
      • लेकिन अब LLM की मेहनत वाले काम संभालने की बढ़ती क्षमता के कारण, संभव है कि वही सही समाधान साबित हों
      • उदाहरण: Python 3.14 में external debugger interface शामिल है — agentic coding tools के लिए एक शानदार फीचर
  • slop के साथ काम करना

    • यह कुछ विवादास्पद हो सकता है, लेकिन इस साल जो चीज़ manage नहीं हो पाई वह थी काम को पूरी तरह मशीन पर छोड़ देना
    • अब भी इसे सामान्य software engineering की तरह ही लिया जाता है और काफ़ी review किया जाता है
    • लेकिन अब यह साफ़ हो रहा है कि अधिक से अधिक लोग इस engineering model से नहीं, बल्कि पूरी तरह मशीन को सौंपकर काम कर रहे हैं
      • यह पागलपन जैसा लग सकता है, लेकिन कुछ लोगों को इसमें काफ़ी सफलता मिलती दिखी है
      • इसे लेकर अभी भी स्पष्ट राय नहीं है, लेकिन यह साफ़ है कि उस नई दुनिया में काम करने का तरीका, जहाँ code अंततः generated होता है, उस दुनिया से बहुत अलग है जिसमें लेखक सहज है
      • और क्योंकि वह दुनिया अब आ चुकी है, शायद इन्हें अलग रखने के लिए एक नए social contract की ज़रूरत होगी
    • इसका सबसे स्पष्ट रूप यह है कि open source projects में इस तरह के contributions बढ़ रहे हैं
      • ईमानदारी से कहें तो, जो लोग उस मॉडल पर काम नहीं करते उनके लिए यह अपमानजनक है
      • ऐसे pull requests पढ़कर काफ़ी गुस्सा आता है
    • व्यक्तिगत रूप से इस समस्या से contribution guidelines और pull request templates के ज़रिए निपटने की कोशिश की गई
      • लेकिन यह पवनचक्कियों से लड़ने जैसा लगता है
      • हो सकता है इसका समाधान हमारे अपने काम करने के तरीके बदलने से न आए
      • इसके बजाय, शायद समाधान वहाँ से आए जहाँ AI engineering के समर्थक और प्रभावशाली लोग यह बताएं कि agentic codebases में अच्छा व्यवहार क्या है
      • और वह unreviewed code फेंक देना और उसका झंझट किसी और पर छोड़ देना नहीं है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.