- 2025 में coding agent को खुद बनाना किसी व्यक्तिगत developer के लिए आज़माने लायक सबसे बेहतरीन projects में से एक है
- agent सिर्फ 300 lines of code और LLM token loop से चलता है, और इसे बनाकर आप consumer नहीं बल्कि AI producer बनने का मौका पा सकते हैं
- इसके बुनियादी components हैं file read, file list, Bash execution, file edit, code search जैसे tools, जिनसे वास्तविक automation features लागू किए जा सकते हैं
- model चुनते समय Claude Sonnet, Kimi K2 जैसे agentic models उपयुक्त हैं, और ज़रूरत पड़ने पर GPT जैसे oracle model को tool की तरह जोड़कर उच्च-स्तरीय validation किया जा सकता है
- वास्तव में Amp, Cursor, Claude Code, GitHub Copilot जैसे commercial products भी इसी तरह की संरचना पर आधारित हैं
Workshop overview
- Geoffrey Huntley द्वारा संचालित यह free workshop, coding agent को खुद बनाने के तरीकों और उसके सिद्धांतों को hands-on तरीके से समझाती है
- Roo code, Cline, Amp, Cursor, Windsurf, OpenCode जैसे मौजूदा commercial AI assistants के साथ इसकी संरचना और सिद्धांत की तुलना करते हुए, इसे खुद implement करने का अवसर देती है
- इसे बनाने के अनुभव के जरिए आप केवल AI user से आगे बढ़कर AI का उपयोग करके automation tools बनाने वाले developer के रूप में विकसित हो सकते हैं
- इसकी मुख्य संरचना लगभग 300 lines के code में LLM tokens को loop के रूप में इस्तेमाल करके agent features बनाने की है
- हर tool के primitive functions (read, file list, execute, edit, code search) जोड़ते हुए वास्तविक working examples और code GitHub repository में सार्वजनिक किए गए हैं
Agent क्या है
- हाल के समय में "agent" शब्द का व्यापक उपयोग हो रहा है, लेकिन इसका वास्तविक अर्थ और अंदरूनी working principle स्पष्ट नहीं है
- agent बनाना आसान होने के साथ, अब केवल AI consumer बने रहने के बजाय कामकाजी automation को आगे बढ़ाने वाले producer के रूप में विकसित होना संभव है
- 2025 के हिसाब से, जैसे database की बुनियादी अवधारणाएँ (Primary key) ज़रूरी हैं, वैसे ही agent बनाने के सिद्धांत भी अनिवार्य ज्ञान बनते जा रहे हैं
- Canva जैसी कंपनियाँ पहले से ही interviews में AI के उपयोग को प्रोत्साहित कर रही हैं, और AI automation capability hiring का मुख्य तत्व बनती जा रही है
- अब पीछे रह जाने की वजह AI नहीं, बल्कि self-development के जरिए नए tools न सीखना है
Coding agent के मूल सिद्धांत
- coding agent केवल 300 lines of code और LLM token loop से बनता है, और token inputs की पुनरावृत्ति के जरिए काम करता है
- concurrent work की अवधारणा महत्वपूर्ण है
- उदाहरण: Zoom meeting के दौरान भी agent parallel में काम कर सकता है, जिससे काम की efficiency काफी बढ़ जाती है
- हर LLM agentic नहीं होता
- 'high-safety' (उदा: Anthropic, OpenAI)
- 'low-safety' (उदा: Grok)
- 'oracle' (summary और high-level reasoning में उपयोगी)
- 'agentic' (action bias, तेज़ iteration और tool calling)
- developers को हर model की विशेषताओं को समझकर अपने उद्देश्य के अनुसार model चुनना चाहिए
- बिना सोचे-समझे context window बढ़ाना performance को खराब कर सकता है, और यह याद रखना चाहिए कि "कम देने पर बेहतर परिणाम मिलते हैं"
- ज़रूरत से ज़्यादा MCP tools register करना भी performance गिराता है
- नियम: “Less is more” → सर्वोत्तम performance के लिए सिर्फ उतने ही tools और data को context में रखना चाहिए जितनी आवश्यकता हो
Coding agent बनाने की प्रक्रिया
-
1. Tool registration और function calling
- उदाहरण के लिए, LLM में weather lookup tool register किया जा सकता है ताकि उपयुक्त स्थिति में वह function call format में प्रतिक्रिया दे सके
- MCP(Model Context Protocol) किसी "function information banner" जैसा है, और केवल function description register करने से भी automatic calling संभव हो जाती है
-
2. Primitive tools के मुख्य functions
- File read(ReadFile): path देने पर file content को context में पढ़कर लाता है
- File list(ListFiles): directory के अंदर files और folders की सूची देता है
- Command execution(Bash): LLM system shell commands चलाकर उनका result लौटाता है
- File edit(Edit): चुनी हुई file को create या modify करने की प्रक्रिया को automate करता है
- Code search(CodeSearch): pattern, keyword या function name के आधार पर पूरे codebase में तेज़ी से search करता है (ripgrep का उपयोग)
-
3. Examples और result flow
- हर tool को LLM में integrate करके सिर्फ natural language prompt से लगातार tasks (जैसे FizzBuzz code generation → run verification, directory exploration → content analysis) automate किए जा सकते हैं
- tool functions user input या scenario के अनुसार क्रम से call होते हैं और उनके results loop के भीतर बार-बार लौटाए जाते हैं
- agent का मुख्य operation sequence: user input → tool call की ज़रूरत का निर्णय → tool execution → result को context में assign करना → repeat
विस्तार की संभावना और open source
- वर्तमान में ज़्यादातर coding agents ripgrep जैसे मौजूदा open source tools पर आधारित हैं
- GitHub पर SST Open Code, mini-swe-agent जैसे सिर्फ 100 lines में बने सरल लेकिन शक्तिशाली agent projects उपलब्ध हैं, जिनसे performance और structure का संदर्भ लिया जा सकता है
- developers को केवल existing products की तुलना करने के बजाय खुद बनाकर उसके सिद्धांतों को समझने और इस्तेमाल करने की सलाह दी जाती है
- वास्तविक काम और automation में लागू करने पर, अपने agent बनाना और उन्हें संगठन के भीतर फैलाना प्रतिस्पर्धात्मक बढ़त में बदल सकता है
निष्कर्ष और संकेत
- coding agent कोई अत्यधिक जटिल तकनीक नहीं, बल्कि सरल loop structure और tools के संयोजन से बना होता है
- coding agent बनाने का मूल है structure की समझ और तेज़ execution की क्षमता, और इसे खुद बनाने का अनुभव AI तकनीक के बदलावों का सक्रिय रूप से सामना करने में मदद करता है
- महत्वपूर्ण बात AI स्वयं नहीं, बल्कि लगातार self-development और tool-building capability में निवेश है, जो इस समय व्यक्तिगत विकास की सबसे अहम रणनीति है
- “खतरा यह नहीं कि AI आपका काम छीन लेगा, बल्कि यह कि आपका सहकर्मी agent से लैस होकर automation करेगा और आपसे तेज़ काम करेगा”
अभी कोई टिप्पणी नहीं है.