Claude Skills (Anthropic के AI एजेंट फीचर) की आंतरिक संरचना का रिवर्स-इंजीनियरिंग आधारित गहन विश्लेषण। Skills का व्यावहारिक तरीका यह है कि यह जटिल कार्यों को ऑटोमेट करते हुए भी उपयोगकर्ता नियंत्रण बनाए रखता है, क्योंकि यह code execution के बजाय prompt injection से Claude AI का व्यवहार बदलता है।

मुख्य बिंदु:

1. कोर कॉन्सेप्ट: Skills एक prompt template हैं
  • Skills Python/JS जैसे executable code का उपयोग नहीं करते, बल्कि domain-specific निर्देश (जैसे PDF प्रक्रिया गाइड) को conversation context में inject करते हैं।
  • सामान्य tools (Read, Write, Bash आदि) से अलग, ये तुरंत execute नहीं होते; ये Claude को “ready” होने में मदद करते हैं। उदाहरण के लिए, PDF skill कॉल करने पर 500~5,000 शब्दों के विस्तृत prompt को hidden message के रूप में भेजा जाता है।
2. Meta-tool architecture
  • 'Skill' meta-tool सभी अलग-अलग skills (PDF, skill-creator आदि) को manage करता है और केवल LLM inference से उपयोगकर्ता intent को match करता है (embedding/classifier नहीं होता)।
  • execution के दौरान दो संदेश inject होते हैं: UI में दिखाई देने वाली concise XML स्थिति ("PDF skill load हो रहा है") और hidden full guide।
3. SKILL.md संरचना और resources
  • फ्रंटमैटर (YAML): name, description (Claude चयन संकेत), allowed-tools (auto-approved tools, security considerations), model सेटिंग।
  • Markdown content: workflow, tool usage क्रम, output format निर्देश (5,000 शब्दों के अंदर)।
  • सपोर्टेड directories: scripts/(automation scripts), references/(reference docs), assets/(templates/images, token बचत)।
4. execution context बदलाव और patterns
  • Skill कॉल पर tool permissions को automate तरीके से बदलना (temporary approval) और model switching संभव है (contextModifier function implementation के साथ)।
  • प्रैक्टिकल patterns:
    • स्क्रिप्ट ऑटोमेशन: बहु-चरणीय स्क्रिप्ट रन।
    • Read-Process-Write: डेटा ट्रांसफॉर्म/क्लीनअप।
    • सर्च-एनालिसिस-रिपोर्ट: codebase analysis (Grep का उपयोग)।
    • विज़ार्ड workflow: चरण-दर-चरण user confirmation।
5. सीमाएँ और अर्थ
  • सीमाएँ: concurrency उपलब्ध नहीं, token overhead (1,500+), prompt dependency।
  • फायदे: flexibility और safety पर जोर। यह "critical निर्णय user के, repetitive काम AI के" वाला collaboration मॉडल प्रस्तुत करता है। AI एजेंट के भविष्य के लिए, prompt-based implementation मुख्य है।

(मूल स्रोत: leehanchung.github.io, 2025.10.26 को प्रकाशित)

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.