- AI प्रोग्रामिंग सहायक Sketch को विकसित करने के अनुभव के माध्यम से LLM और टूल उपयोग को जोड़ने वाली लूप संरचना के संक्षिप्त implementation पर ज़ोर दिया गया है
- केवल 9 पंक्तियों के लूप कोड से Claude 3.7 Sonnet जैसे आधुनिक LLM वास्तविक समस्याओं को तेज़ी से हल कर देते हैं
- सिर्फ़ bash जैसे एक सामान्य-उद्देश्य वाले टूल से भी डेवलपर के दोहराव वाले और जटिल कामों का बड़ा हिस्सा automate किया जा सकता है
- समस्या समाधान के अलावा, अतिरिक्त टूल जोड़कर text editing या विशेषीकृत कार्यों की गुणवत्ता और दोहराव की गति बढ़ाई जा सकती है
- धीरे-धीरे अधिक custom LLM agent loops डेवलपर्स की रोज़मर्रा की automation में शामिल हो रहे हैं
परिचय: डेवलपमेंट अनुभव और Sketch प्रोजेक्ट
- फिलिप ज़ेलिगर और उनके सहयोगियों ने AI-आधारित programming assistant Sketch बनाते समय LLM और टूल उपयोग को मिलाने वाली एक सरल agent loop संरचना की उच्च दक्षता देखकर आश्चर्य व्यक्त किया
- मुख्य संरचना केवल 9 पंक्तियों के लूप कोड की है, जो system prompt, conversation history और नवीनतम message को LLM API तक भेजती है
- LLM output बनाता है और ज़रूरत पड़ने पर
tool_calls (टूल कॉल अनुरोध) वापस करता है
LLM और टूल उपयोग का एकीकरण
- "टूल उपयोग (tool use)" का अर्थ है कि LLM पहले से परिभाषित schema के अनुरूप output लौटाता है, और system prompt तथा tool description prompt के माध्यम से LLM को
bash जैसे सामान्य-उद्देश्य वाले टूल तक पहुँच मिलती है
- आधुनिक LLM (जैसे Claude 3.7 Sonnet) केवल एक सामान्य-उद्देश्य वाले टूल से भी विभिन्न समस्याओं को जल्दी automate कर देते हैं, और कुछ मामलों में एक ही रन ("one shot") में समाधान संभव होता है
- पहले जटिल
git कमांड खोजकर copy-paste करनी पड़ती थीं और merge का काम हाथ से करना पड़ता था, लेकिन अब Sketch से कहकर वही काम तुरंत कराया जा सकता है
- type बदलने के बाद उत्पन्न होने वाली कई type check errors को भी Sketch ने पहली बार अपने-आप संभाला
- agent loop सतत और अनुकूलनशील तरीके से काम करता है, इसलिए टूल इंस्टॉल न होने पर उसे अपने-आप इंस्टॉल कर लेता है और कमांड विकल्पों के फ़र्क के अनुसार भी अनुकूल प्रतिक्रिया देता है
- उपयोग के दौरान कभी-कभी LLM test fail होने पर "test skip करो" जैसी अप्रत्याशित सलाह देता है, लेकिन कुल मिलाकर workflow automation की गुणवत्ता बेहतर हुई है
टूल्स की विविधता और विशेषीकरण
- Sketch ने
bash के अलावा अतिरिक्त टूल्स (जैसे text editing tools) का उपयोग करने पर काम की गुणवत्ता बढ़ने और डेवलपमेंट workflow के और अधिक कुशल होने का अनुभव किया
sed आदि के ज़रिए टेक्स्ट को सटीक रूप से संशोधित करना LLM के लिए अपेक्षा से अधिक कठिन होता है, और visual editor शैली के टूल अधिक बेहतर साबित होते हैं
भविष्य की दिशा और workflow में बदलाव
- agent loop संरचना उन दोहराव वाले कामों में बढ़ते हुए इस्तेमाल होने की संभावना रखती है, जिन्हें पारंपरिक general-purpose automation tools से संभालना कठिन था और जो डेवलपर के रोज़मर्रा के काम का हिस्सा हैं
- उदाहरण के तौर पर, stack trace और git commit के सहसंबंध का विश्लेषण जैसे झंझट वाले और दोहरावपूर्ण कामों में भी LLM तेज़ी से शुरुआती प्रोसेसिंग कर सकता है
- आगे चलकर और अधिक custom-built, one-off LLM agent loops डेवलपर्स की
bin/ directory जैसी जगहों पर इस्तेमाल होते दिख सकते हैं
- उपयोगकर्ता अपनी पसंद का bearer token तैयार करके अपने environment में इसे आसानी से आज़मा सकते हैं
संदर्भ लिंक
1 टिप्पणियां
Hacker News राय
?utm_source=hn&utm_medium=browserजोड़ना चाहिए या नहीं, यही सोच रहा हूँ// omitted for brevityजैसा काटा हुआ था, इसलिए इस्तेमाल लायक नहीं था। यहीं मैंने हार मान ली। सोच रहा हूँ कि क्या agents इस समस्या को हल करते हैं। फिलहाल तो मुझे यह अनुभव पूरी तरह टूटा हुआ लगता है, और ऐसी हालत में इसे bash access देना बहुत खतरनाक लगता है