एजेंट स्किल्स (Agent Skills)
(agentskills.io)- Agent Skills AI एजेंट्स में नई क्षमताएँ और विशेषज्ञ ज्ञान जोड़ने के लिए एक open format है
- Anthropic द्वारा विकसित किए जाने के बाद इसे open standard के रूप में जारी किया गया, और कई एजेंट प्रोडक्ट्स इसे अपना रहे हैं
- स्किल्स निर्देश, scripts, resources से बने फ़ोल्डर के रूप में होती हैं, जिन्हें एजेंट खोजकर अधिक सटीक और कुशल तरीके से काम करता है
- यह domain expertise, नई functionality का विस्तार, दोहराए जा सकने वाले workflows, और interoperability को सपोर्ट करती हैं
- कंपनियाँ और डेवलपर्स इसके जरिए संगठनात्मक ज्ञान के पुन: उपयोग और deployment automation को संभव बना सकते हैं
अवलोकन
- Agent Skills एजेंट्स को नई क्षमताएँ और विशेषज्ञता देने के लिए एक सरल और खुला format है
- हर skill commands, scripts, resources वाले एक फ़ोल्डर से बनी होती है, जिसे एजेंट लोड करके काम की सटीकता और दक्षता बढ़ाता है
Agent Skills क्यों
- एजेंट्स लगातार अधिक शक्तिशाली हो रहे हैं, लेकिन वास्तविक काम को भरोसेमंद ढंग से करने के लिए context information की कमी की समस्या बनी रहती है
- skills procedural knowledge और संगठन, टीम, या उपयोगकर्ता-विशिष्ट context को जरूरत पड़ने पर लोड करने की सुविधा देती हैं
- skills वाले एजेंट्स काम के अनुसार अपनी क्षमताओं का विस्तार कर सकते हैं
- skill authors एक बार बनाई गई functionality को कई एजेंट प्रोडक्ट्स में deploy कर सकते हैं
- compatible agents में उपयोगकर्ता तुरंत नई functionality जोड़ सकते हैं
- टीम्स और कंपनियाँ अपने संगठन के ज्ञान को version-controlled portable packages के रूप में संरक्षित कर सकती हैं
Agent Skills से क्या किया जा सकता है
- domain expertise: कानूनी समीक्षा, data analysis जैसी विशेष जानकारी को पुन: प्रयोज्य निर्देशों के रूप में package करना
- नई functionality: presentation बनाना, MCP server बनाना, dataset analysis जैसी कई क्षमताएँ जोड़ना
- दोहराए जा सकने वाले workflows: multi-step काम को सुसंगत और audit किए जा सकने वाले process में बदलना
- interoperability: एक ही skill को कई compatible एजेंट प्रोडक्ट्स में पुन: उपयोग करना
अपनाने की स्थिति
- Agent Skills को कई AI development tools सपोर्ट करते हैं
- उदाहरण के तौर पर Factory.ai, Gemini CLI, Mux, Ampcode, Letta, Autohand.ai, Spring AI, Goose, Piebald.ai, OpenAI Codex, Cursor, Databricks, Mistral Vibe, Roocode, VS Code, Agentman.ai, Trae.ai, Commandcode.ai, Firebender, Opencode.ai, Claude.ai आदि शामिल हैं
ओपन डेवलपमेंट
- Agent Skills format को सबसे पहले Anthropic ने विकसित किया और open standard के रूप में जारी किया
- इसके बाद कई एजेंट प्रोडक्ट्स ने इसे अपनाया है, और यह पूरे ecosystem से contribution की अनुमति देता है
- GitHub repository के जरिए format और example skills देखे जा सकते हैं
शुरुआत करें
- “What are skills?” पेज पर skill की संरचना और काम करने का तरीका सीखा जा सकता है
- “Specification” में SKILL.md फ़ाइल के format specification देखे जा सकते हैं
- “Integrate skills” के जरिए एजेंट या टूल में skill support जोड़ा जा सकता है
- GitHub पर example skills और reference library देखी जा सकती हैं
6 टिप्पणियां
Anthropic का official repo मौजूद है, फिर third-party में ऐसे प्रोजेक्ट्स क्यों बनाए जा रहे हैं?
लगता है standard Anthropic ने बनाया है।
यह भी official ही है.. https://github.com/anthropics/skills क्या यह उससे अलग है?
हाँ, आपने जो भेजा है वह implementation है
मुख्य लेख में जो साझा किया गया है वह Spec है
कुछ-कुछ ऐसे
Docker जैसे किसी चीज़ का standard = OCI
Docker, podman = OCI को implement करने वाले container runtime
(मैं गलत भी हो सकता हूँ)
आह, तो यह spec और implementation हैं.. धन्यवाद
Hacker News की टिप्पणियाँ
यह चर्चा मानकीकरण की आवश्यकता पर सवाल से शुरू होती है
मेरा मानना है कि अच्छे दस्तावेज़ का मूल अब भी यही है कि वह “इंसानों के पढ़ने में आसान” हो। ऐसे में क्या सचमुच कोई नया फ़ॉर्मैट थोपने की ज़रूरत है? अगर प्रोडक्टिविटी में बढ़ोतरी सच में होती है, तो इसे comparative studies से साबित किया जा सकता है
हमारी टीम ने skills को पुन: प्रयोज्य अर्ध-नियतात्मक functions की तरह संभाला और अच्छा परिणाम पाया
उदाहरण के लिए
/create-new-endpointskill में OpenAPI अपडेट करना, integration test जोड़ना आदि सभी boilerplate शामिल हैं। CLI में JIRA ticket number देने पर LLM लगातार एकसमान quality के साथ काम पूरा कर देता हैfolder structure को standardize करने का एक प्रस्ताव था
.mdफ़ाइलें scan करके चलाते हैं। फिर भी plugins तक शामिल करने वाला एकीकृत standardization अच्छा रहेगा~/.config/claudeजैसे path इस्तेमाल करना बेहतर होगा। मौजूदा~/.claudeतरीका असुविधाजनक बताया गयाएक टिप यह थी कि हर subfolder में README.md बनाकर संबंधित skill के links दें। यह इंसानों के लिए भी उपयोगी है। संबंधित लेख: Claude Skills Considered Harmful
justजैसे command runner इंसानों और agents दोनों के लिए मददगार हो सकते हैंमेरे लिए skills को स्पष्ट workflow की तरह संभालना प्रभावी रहा
अगर इसे “X करो, फिर Y करो, फिर Z verify करो” जैसी पूर्ण प्रक्रिया के रूप में परिभाषित किया जाए, तो agent इसे एक mode की तरह पहचानता है। इसके उलट, अस्पष्ट guideline जैसी चीज़ों को नज़रअंदाज़ किए जाने की संभावना ज़्यादा होती है
/fooजैसी explicit invocation संभव है, इसलिए वह उसी तरीके को पसंद करता हैकिसी का मानना था कि skills के ज़रिए अंतर्निहित domain knowledge को document किया जा सकता है। डेवलपर के दिमाग़ में मौजूद नियमों को रिकॉर्ड किया जा सकता है, और बाद में उन्हें LLM training में दोबारा इस्तेमाल किया जा सकता है
यह सवाल उठा: “अगर agent खुद request न करे, तो क्या वह skills का उपयोग नहीं करता?”
कहा गया कि skills.sh पर तीसरा सबसे लोकप्रिय skill सिर्फ़ एक command download link था। ऐसे SKILLS.md/AGENTS.md/COMMANDS.md फ़ाइलें आखिरकार prompts का संग्रह भर हैं, और गलत तरीके से इस्तेमाल होने पर जोखिम पैदा कर सकती हैं
एक नए programming language पर काम कर रहा व्यक्ति कहता है कि वह AGENTS.md और SKILLS का इस्तेमाल इसलिए करता है ताकि LLM उस भाषा को समझ सके जिस पर उसे train नहीं किया गया। उसके अनुसार standardization की वजह से tool integration आसान हो गया
असली मूल्य फ़ॉर्मैट में नहीं, बल्कि progressive disclosure में है
अगर सभी निर्देश एक ही दस्तावेज़ में ठूँस दिए जाएँ, तो अनावश्यक token खर्च होते हैं। skills pattern ज़रूरत पड़ने पर ही विवरण बुलाने देता है। standardization मुख्यतः distribution और reuse के लिए है
GLANCE.yml → CARD.yml → SKILL.md → README.md क्रम में प्रगतिशील refinement लागू किया जाता है।
GLANCE 5~70 पंक्तियों में सिर्फ़ यह तय करता है कि “क्या यह प्रासंगिक है?”, CARD interface definition है, SKILL वास्तविक प्रक्रिया है, और README इंसानों के लिए विवरण है।
उनका कहना है कि INDEX.md, INDEX.yml की तुलना में 80% से अधिक compression देता है और narrative structure प्रदान करता है।
संबंधित लिंक: INDEX.yml, INDEX.md
साथ ही sniffable-python संरचना के ज़रिए कोड की शुरुआती 50 पंक्तियाँ पढ़कर ही API समझी जा सकती है।
संबंधित सामग्री: Semantic Image Pyramid विवरण, sister-script, sniffable-python README, sniffable-python SKILL