81 पॉइंट द्वारा flowkater 2026-03-01 | 3 टिप्पणियां | WhatsApp पर शेयर करें

Vibe Coding के जनक का वीकेंड

  • Karpathy ने अपना वीकेंड प्रोजेक्ट एक agent को सौंप दिया। सिर्फ IP, username, password और goal दिया, और 30 मिनट बाद सब कुछ तैयार था
  • 99% समय खुद कोड लिखने के बजाय agent को निर्देश देना और उसकी निगरानी करना — यही है "agentic engineering"
  • लेकिन 60% डेवलपर AI का इस्तेमाल करने के बावजूद पूरी तरह delegation सिर्फ 0-20% तक ही करते हैं — delegation paradox. "Do you trust your agents?" ज़्यादातर का जवाब अभी भी "नहीं" है

① विखंडन क्षमता (Decomposition)

  • अगर आप कहें "signup feature बना do", तो कुछ न कुछ बनकर आ जाएगा। समस्या यह है कि उसके वही होने की संभावना कम है जो मैं वास्तव में चाहता था
  • AddPlan स्क्रीन को सिर्फ PRD देकर agent पर छोड़ दिया, तो ping-pong के दर्जनों टर्न चले और आधा दिन निकल गया
  • AI के साथ Socratic बातचीत में 5 मिनट की इंटरव्यू → edge cases पहले से व्यवस्थित → revision 2-3 टर्न तक सिमट गया
  • implementation से पहले सोचने के लिए समय निकालना, वही 5 मिनट 4 घंटे बचा देता है

② कॉन्टेक्स्ट डिज़ाइन (Context Architecture)

  • AGENTS.md को अच्छे से लिखना महत्वपूर्ण है, लेकिन अगर code architecture खुद अच्छी तरह डिज़ाइन हो, तो agent के लिए context समझने की गति पूरी तरह बदल जाती है
  • flat directory में भटक रहा agent, feature-आधारित directory structure में दोबारा व्यवस्थित करते ही तुरंत सुधर गया
  • Armin Ronacher: "Tools को इस बात के लिए तैयार रहना चाहिए कि LLM chaos monkey उन्हें पूरी तरह गलत तरीके से इस्तेमाल करेगा"

③ पूर्णता की परिभाषा (Definition of Done)

  • CLI प्रोजेक्ट को रात भर चलने दिया, लेकिन वह 1 घंटे में ही खत्म हो गया — type definitions सेट थीं, पर business logic सिर्फ खाली खोल था
  • दूसरे प्रयास में agent ने test को भी अपनी सुविधा के हिसाब से फिर से लिख दिया
  • agent का "done", मेरे "done" से अलग है
  • Elvis का 7-स्टेज DoD सिस्टम(PR→CI→code review 3 ge→Telegram) भले ही extreme लगे, लेकिन दिशा दिखाता है

④ विफलता से उबरना (Failure Recovery Loop)

  • redistribution engine में एक ही parameter का अलग-अलग functions में अलग semantics था → A ठीक करो तो B टूट जाता, और यह अनंत loop बन गया
  • एक ही prompt के साथ दोबारा कोशिश करना, दीवार पर उसी दिशा में बार-बार सिर मारने जैसा है
  • विफलताओं को 3 हिस्सों में बाँटें (context की कमी, direction error, structural conflict), तो इलाज साफ़ हो जाता है
  • "Must NOT Have" guardrail ने उस अनंत loop को तोड़ा

⑤ ऑब्ज़र्वेबिलिटी (Observability)

  • liquidglass को agent पर छोड़कर "कुछ अजीब है... रहने दो" कहना सबसे महँगा फ़ैसला साबित हुआ
  • 20 files उलझ चुकी थीं और rollback नामुमकिन था
  • उसके बाद tracer-bullet strategy + blueprint — पहली बार लागू होने वाली तकनीक के लिए blueprint पहले से नहीं बनाया जा सकता, इसलिए tracer bullet उसे जल्दी उकेर देती है
  • ऑब्ज़र्वेबिलिटी भरोसा बनाती है, और भरोसा delegation को संभव बनाता है

⑥ मेमोरी डिज़ाइन (Memory Architecture)

  • अगर 3 दिन लगातार काम करें, तो हर सुबह 15 मिनट सिर्फ context समझाने में निकल जाते हैं
  • Claude Code hooks से session खत्म होते ही memory अपने आप extract हो जाती है → अगला session 5 सेकंड में restore
  • Boris Cherny की टीम CLAUDE.md को git में check-in करती है ताकि पूरी टीम उसे साझा कर सके
  • ऐसी संरचना जिसमें agent तक किसी व्यक्ति की याद नहीं, बल्कि पूरी टीम की स्मृति पहुँचे

⑦ पैरलल मैनेजमेंट (Parallel Orchestration)

  • Boris Cherny एक साथ 10-15 parallel sessions चलाते हैं
  • CTO के रूप में 6 squads मैनेज करने का अनुभव, agent parallel management से हैरान कर देने वाली हद तक मिलता-जुलता था
  • यह ADHD नहीं, बल्कि intentional multitasking = management है
  • इंसान सवाल पूछता है, लेकिन agent बिना पूछे अपने निर्णय से आगे बढ़ता है — इसलिए pre-design और भी महत्वपूर्ण है

⑧ abstraction layers का डिज़ाइन (Abstraction Layering)

  • Level 0(खुद coding) → Level 1(agent को निर्देश) → Level 2(orchestrator) → Level 3(meta design)
  • रोज़ की 20 मिनट वाली routine को एक skill में बदलकर 2 मिनट तक घटाने का अनुभव
  • compounding engineering — प्रोजेक्ट कोई finish-line game नहीं, बल्कि compounding game है। पहले के sessions बाद में compound होकर असर डालते हैं

⑨ taste (रुचि/निर्णयबोध)

  • AI से बना design 60-70 अंक का था। लेकिन जैसे ही Ellie का design आया, तुरंत लगा: "हाँ, यह काम करेगा"
  • AI से बना information-summary post पर likes 0, जबकि impulsively लिखा गया एक-line brag post 30,000 views ले आया
  • KinglyCrow का "No Skill, No Taste" — LLM ने skill की entry barrier घटाई है, लेकिन असली barrier यानी taste को और बढ़ा दिया है
  • Chris Lattner: "जितना implementation automate होगा, उतनी ही design, judgment और taste की अहमियत बढ़ेगी"
  • जब 80% हर जगह भर गया हो, तब differentiation बाकी 20% से आता है

अंत में

  • खत्म टाइपिंग हुई है, engineering नहीं
  • ये 9 बातें AI से पहले भी अच्छे engineers की पहचान थीं
  • अच्छी design का leverage बढ़ा है, लेकिन खराब design का नुकसान भी उतना ही बढ़ गया है
  • उस शो का असली नायक AI नहीं, बल्कि AI को अच्छी तरह संभालने वाला engineer है

3 टिप्पणियां

 
armila 2026-03-03

अगर SSoT को अच्छी तरह बनाए रखें, तो hallucination काफ़ी कम हो जाती है। Tokens भी बचते हैं।

 
tsboard 2026-03-03

"खत्म टाइपिंग हुई है, इंजीनियरिंग नहीं।"

सहमत हूँ। हाहा

 
yangeok 2026-03-02

धन्यवाद। मुझे डर लग रहा था कि अब cowork आ गया है जो सिर्फ PC चालू छोड़ देने पर सर्वर की भूमिका भी निभा देता है, लेकिन अब थोड़ी तसल्ली हुई और आगे यह कैसे बदलेगा, इसकी एक तस्वीर दिमाग में बनने लगी है, हाहा