Vibe Coding के जनक का वीकेंड

  • Karpathy ने अपना वीकेंड प्रोजेक्ट एक agent को सौंप दिया। सिर्फ IP, username, password और goal दिया, और 30 मिनट बाद सब कुछ तैयार था
  • 99% समय खुद कोड लिखने के बजाय agent को निर्देश देना और उसकी निगरानी करना — यही है "agentic engineering"
  • लेकिन 60% डेवलपर AI का इस्तेमाल करने के बावजूद पूरी तरह delegation सिर्फ 0-20% तक ही करते हैं — delegation paradox. "Do you trust your agents?" ज़्यादातर का जवाब अभी भी "नहीं" है

① विखंडन क्षमता (Decomposition)

  • अगर आप कहें "signup feature बना do", तो कुछ न कुछ बनकर आ जाएगा। समस्या यह है कि उसके वही होने की संभावना कम है जो मैं वास्तव में चाहता था
  • AddPlan स्क्रीन को सिर्फ PRD देकर agent पर छोड़ दिया, तो ping-pong के दर्जनों टर्न चले और आधा दिन निकल गया
  • AI के साथ Socratic बातचीत में 5 मिनट की इंटरव्यू → edge cases पहले से व्यवस्थित → revision 2-3 टर्न तक सिमट गया
  • implementation से पहले सोचने के लिए समय निकालना, वही 5 मिनट 4 घंटे बचा देता है

② कॉन्टेक्स्ट डिज़ाइन (Context Architecture)

  • AGENTS.md को अच्छे से लिखना महत्वपूर्ण है, लेकिन अगर code architecture खुद अच्छी तरह डिज़ाइन हो, तो agent के लिए context समझने की गति पूरी तरह बदल जाती है
  • flat directory में भटक रहा agent, feature-आधारित directory structure में दोबारा व्यवस्थित करते ही तुरंत सुधर गया
  • Armin Ronacher: "Tools को इस बात के लिए तैयार रहना चाहिए कि LLM chaos monkey उन्हें पूरी तरह गलत तरीके से इस्तेमाल करेगा"

③ पूर्णता की परिभाषा (Definition of Done)

  • CLI प्रोजेक्ट को रात भर चलने दिया, लेकिन वह 1 घंटे में ही खत्म हो गया — type definitions सेट थीं, पर business logic सिर्फ खाली खोल था
  • दूसरे प्रयास में agent ने test को भी अपनी सुविधा के हिसाब से फिर से लिख दिया
  • agent का "done", मेरे "done" से अलग है
  • Elvis का 7-स्टेज DoD सिस्टम(PR→CI→code review 3 ge→Telegram) भले ही extreme लगे, लेकिन दिशा दिखाता है

④ विफलता से उबरना (Failure Recovery Loop)

  • redistribution engine में एक ही parameter का अलग-अलग functions में अलग semantics था → A ठीक करो तो B टूट जाता, और यह अनंत loop बन गया
  • एक ही prompt के साथ दोबारा कोशिश करना, दीवार पर उसी दिशा में बार-बार सिर मारने जैसा है
  • विफलताओं को 3 हिस्सों में बाँटें (context की कमी, direction error, structural conflict), तो इलाज साफ़ हो जाता है
  • "Must NOT Have" guardrail ने उस अनंत loop को तोड़ा

⑤ ऑब्ज़र्वेबिलिटी (Observability)

  • liquidglass को agent पर छोड़कर "कुछ अजीब है... रहने दो" कहना सबसे महँगा फ़ैसला साबित हुआ
  • 20 files उलझ चुकी थीं और rollback नामुमकिन था
  • उसके बाद tracer-bullet strategy + blueprint — पहली बार लागू होने वाली तकनीक के लिए blueprint पहले से नहीं बनाया जा सकता, इसलिए tracer bullet उसे जल्दी उकेर देती है
  • ऑब्ज़र्वेबिलिटी भरोसा बनाती है, और भरोसा delegation को संभव बनाता है

⑥ मेमोरी डिज़ाइन (Memory Architecture)

  • अगर 3 दिन लगातार काम करें, तो हर सुबह 15 मिनट सिर्फ context समझाने में निकल जाते हैं
  • Claude Code hooks से session खत्म होते ही memory अपने आप extract हो जाती है → अगला session 5 सेकंड में restore
  • Boris Cherny की टीम CLAUDE.md को git में check-in करती है ताकि पूरी टीम उसे साझा कर सके
  • ऐसी संरचना जिसमें agent तक किसी व्यक्ति की याद नहीं, बल्कि पूरी टीम की स्मृति पहुँचे

⑦ पैरलल मैनेजमेंट (Parallel Orchestration)

  • Boris Cherny एक साथ 10-15 parallel sessions चलाते हैं
  • CTO के रूप में 6 squads मैनेज करने का अनुभव, agent parallel management से हैरान कर देने वाली हद तक मिलता-जुलता था
  • यह ADHD नहीं, बल्कि intentional multitasking = management है
  • इंसान सवाल पूछता है, लेकिन agent बिना पूछे अपने निर्णय से आगे बढ़ता है — इसलिए pre-design और भी महत्वपूर्ण है

⑧ abstraction layers का डिज़ाइन (Abstraction Layering)

  • Level 0(खुद coding) → Level 1(agent को निर्देश) → Level 2(orchestrator) → Level 3(meta design)
  • रोज़ की 20 मिनट वाली routine को एक skill में बदलकर 2 मिनट तक घटाने का अनुभव
  • compounding engineering — प्रोजेक्ट कोई finish-line game नहीं, बल्कि compounding game है। पहले के sessions बाद में compound होकर असर डालते हैं

⑨ taste (रुचि/निर्णयबोध)

  • AI से बना design 60-70 अंक का था। लेकिन जैसे ही Ellie का design आया, तुरंत लगा: "हाँ, यह काम करेगा"
  • AI से बना information-summary post पर likes 0, जबकि impulsively लिखा गया एक-line brag post 30,000 views ले आया
  • KinglyCrow का "No Skill, No Taste" — LLM ने skill की entry barrier घटाई है, लेकिन असली barrier यानी taste को और बढ़ा दिया है
  • Chris Lattner: "जितना implementation automate होगा, उतनी ही design, judgment और taste की अहमियत बढ़ेगी"
  • जब 80% हर जगह भर गया हो, तब differentiation बाकी 20% से आता है

अंत में

  • खत्म टाइपिंग हुई है, engineering नहीं
  • ये 9 बातें AI से पहले भी अच्छे engineers की पहचान थीं
  • अच्छी design का leverage बढ़ा है, लेकिन खराब design का नुकसान भी उतना ही बढ़ गया है
  • उस शो का असली नायक AI नहीं, बल्कि AI को अच्छी तरह संभालने वाला engineer है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.