ज़्यादातर लोग कहते हैं कि वे Claude का इस्तेमाल करके कई agents बनाते हैं, workflows सेट करते हैं, और अपने-आप design, development, testing सब कर लेते हैं। ऐसे तरीकों पर बहुत से लेख हैं, लेकिन मैं जानना चाहता हूँ कि वे वास्तव में कैसे काम करते हैं। design, development, testing आदि के लिए अलग-अलग models का इस्तेमाल करते हुए कौन-सा model किस काम के लिए उपयुक्त है, इस पर भी बहुत से लेख हैं.
फ़िलहाल मैं Cursor नाम की चीज़ इस्तेमाल कर रहा हूँ। इसमें model ऊपर बताए गए सभी काम अपने-आप सेट करके इसी एक tool से कर देता है, लेकिन फिर भी लगातार नज़र रखनी पड़ती है, बातचीत करनी पड़ती है, और दिशा देनी पड़ती है। मैं जानना चाहता हूँ कि अगर Claude को ऊपर बताए गए तरीकों से इस्तेमाल करें, तो क्या वह पूरी तरह automatic हो जाता है। मेरे अनुभव में, project जितना बड़ा होता है, अगर लगातार दिशा न दी जाए तो नतीजा उतना ही भटका हुआ या अधूरा हो जाता है। क्या 'पूरी तरह automatic' तरीके पर विस्तार से लिखे गए कोई लेख या वीडियो हैं? ऐसे लेखों या वीडियो में भी मुझे ऐसा कोई विस्तार से समझाया गया तरीका नहीं मिला जिसे देखकर सीधे अपनाया जा सके।
4 टिप्पणियां
पूरी तरह से end-to-end automation की स्थिति हासिल करने की कोशिश करने के बजाय, काम को छोटे हिस्सों में बाँटकर यह तय करना कि किस हिस्से की ज़िम्मेदारी किसकी होगी, मुझे फिलहाल सबसे व्यावहारिक रणनीति लगती है। उदाहरण के लिए, pattern recognition, meaning extraction, और सामान्य ज्ञान से जोड़ने का काम LLM को दिया जा सकता है, जबकि अर्थ देना, context जोड़ना, और decision-making इंसान करे। अगर इसे coding की स्थिति पर लागू करें, तो repetitive code generation या test case लिखना LLM को सौंपा जा सकता है, और architecture decision तथा domain modeling इंसान करे। तब असली सवाल यह रह जाता है कि decision-making को कहाँ तक automate किया जा सकता है, और मुझे लगता है कि तब आप थोड़ा अधिक ठोस उदाहरण आसानी से ढूँढ पाएँगे।
उत्तर के लिए धन्यवाद। जैसा कि मैंने मूल पोस्ट में बताया था, मेरी नज़र ऐसे लेखों पर पड़ी थी, लेकिन उनमें ठोस तरीकों पर चर्चा नहीं थी, इसलिए मैं सोच रहा था कि कहीं कोई अच्छी तरह से जाना-पहचाना दस्तावेज़ या जानकारी उपलब्ध है क्या।
मुझे नहीं पता कि यह आर्थिक स्थिति की वजह से है या नहीं, लेकिन हाल के दिनों में ऐसे बहुत से लेख और लेक्चर दिख रहे हैं जो इस तरह बात करते हैं मानो AI एजेंट से हर चीज़ हल की जा सकती है। लेकिन अभी भी वास्तविक रूप से सिर्फ AI के दम पर हर काम को 100% तक कर पाना मुश्किल है। क्षेत्र के अनुसार यह अधिकतम लगभग 70-80% तक ही संभव दिखता है, और इससे आगे जाने के लिए उस क्षेत्र के विशेषज्ञ की भूमिका अनिवार्य है।
मैंने अभी तक 'पूर्ण स्वचालन' की कार्यप्रणाली पर समझाने वाला कोई लेख या वीडियो नहीं देखा है,
लेकिन लगता है कि इससे जुड़ी चर्चाएँ और प्रयोग अलग-अलग जगहों पर हो रहे हैं।
मुझे लगता है कि नीचे दिए गए लेख लेखक के प्रश्न के लिए संकेत दे सकते हैं!
https://anthropic.com/engineering/…
https://openai.com/ko-KR/index/harness-engineering/
https://github.com/karpathy/autoresearch
https://www.minimax.io/news/minimax-m27-en