मुझे लगता है कि अभी भी बहुत से लोगों के लिए agent एक थोड़ा अमूर्त-सा अस्तित्व है। यह कुछ बहुत शानदार लगता है, लेकिन जब वास्तव में इसके अंदर झाँकते हैं तो यह कैसे काम करता है, इसका अंदाज़ लगाना आसान नहीं होता, और कहाँ से छेड़ना शुरू करें यह भी तुरंत समझ में नहीं आता।

मेरा अनुभव भी कुछ ऐसा ही था। फिर मैंने सुना कि OpenClaw का core pi-mono है, और यह एक बेहद minimal agent है। खास तौर पर मुझे यह इस बात का अच्छा उदाहरण लगा कि "सबसे शक्तिशाली चीज़ एक सरल system होता है"। इसलिए मैंने इसे अपना agent बनाने के लिए एक शुरुआती बिंदु माना, और सोचा कि कम-से-कम उस स्तर तक इसे Python में port करके देखूँ जहाँ यह अपने आप code लिख सके।

दरअसल अभी के py-pimono में pi-mono में पहले से मौजूद लेकिन अब तक शामिल न हो सकी चीज़ें कहीं ज़्यादा हैं। उदाहरण के लिए:

  • session management
  • steering
  • follow-up
  • तरह-तरह की utilities
  • streaming

इस तरह py-pimono किसी complete product से ज़्यादा, ऐसे agent के क़रीब है जिसमें लगभग सिर्फ़ ढाँचा ही बचा है—यानी वास्तव में कुछ खास नहीं है, लेकिन फिलहाल चल तो जाता है। इसके बदले इसकी structure को काफ़ी साफ़ तौर पर सामने रखा गया है, ताकि यह समझना आसान हो कि कहाँ खोलकर देखना है और कहाँ क्या जोड़ना है। इसलिए मुझे लगा कि जिन लोगों के लिए agent अभी भी कुछ अमूर्त है, उनके लिए भी इसकी structure को follow करते हुए हाथ लगाना आसान रहेगा। उदाहरण के लिए, मैं चाहता था कि ऐसे सवालों को जितना हो सके उतने छोटे codebase में trace किया जा सके।

  • कोई यह जानना चाहेगा कि "agent लंबे समय तक लगातार चलता रहता है"—यह बात code में कैसे व्यक्त होती है
  • कोई यह जानना चाहेगा कि session data को कैसे save किया जाता है और फिर दोबारा कैसे load किया जाता है

इसलिए मैंने सोचा कि यह repository इन चीज़ों को जितना संभव हो अलग-अलग रखे, ताकि आप LLM के साथ code को पढ़ते और analyze करते हुए अपना loop या session management जोड़ सकें और structure को धीरे-धीरे expand कर सकें।

लेकिन इसे तुरंत चलाकर हाथ से समझने योग्य बनाने के लिए, इस minimal harness के ऊपर UI भी साथ में जोड़ दिया गया है। अगर आप ui/ directory खोलेंगे, तो वहाँ आपको मेरे द्वारा तरह-तरह से प्रयोग किए गए कई UI और Discord integration भी मिलेंगे।

इंस्टॉल:

pip install py-pimono  

अगर Codex authentication पहले से किया हुआ है, तो इसे तुरंत चला सकते हैं।

pyai  

Codex authentication न होने पर भी fallback के रूप में तोता-जैसा MockLlm चलता है, इसलिए debugging points लगाकर agent loop को देखना भी काफ़ी मज़ेदार है।

अगर Codex authentication अभी नहीं है, तो पहले login करके चलाएँ।

codex login  
pyai  

इसके बाद मुझे लगा कि यहाँ से जो चीज़ें सच में महत्वपूर्ण हैं लेकिन अभी missing हैं, उन्हें जितना संभव हो साफ़ और minimal तरीके से आप सबके साथ मिलकर जोड़ना दिलचस्प होगा। agent को एक अमूर्त चीज़ बनाकर छोड़ देने के बजाय, ज़्यादा लोग उसे खोलकर देखें, बदलकर देखें, और उसे अपना बना सकें—इसी भावना से इसे साझा कर रहा हूँ।

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.