Claude Skills कमाल है, शायद MCP से भी बड़ा इनोवेशन

(simonwillison.net)

52 पॉइंट द्वारा GN⁺ 2025-10-18 | 12 टिप्पणियां | WhatsApp पर शेयर करें

Anthropic द्वारा घोषित Claude Skills एक नया पैटर्न है, जिसमें मॉडल को किसी खास काम को करने के लिए ज़रूरी निर्देश, scripts और resources फ़ोल्डर के रूप में दिए जाते हैं, और यह काम-विशेष विशेषज्ञता को dynamic तरीके से load करता है
Skills Markdown files और optional scripts से मिलकर बनते हैं; session शुरू होने पर हर skill का सिर्फ metadata कुछ दर्जन tokens में load होता है, और पूरा content केवल ज़रूरत पड़ने पर लाया जाता है, इसलिए token efficiency बहुत ऊँची होती है
Claude Code के ज़रिए Skills, एक साधारण coding tool से आगे बढ़कर general-purpose automation agent तक फैलता है; अगर filesystem और command execution environment हो, तो कई तरह के काम automate किए जा सकते हैं
MCP से अलग, Skills protocol नहीं बल्कि Markdown और YAML आधारित एक सरल संरचना है, इसलिए दूसरे models या tools में भी इसे तुरंत इस्तेमाल किया जा सकता है और इसे share व फैलाना आसान है
इसी सादगी और दक्षता की वजह से उम्मीद है कि Skills का ecosystem, MCP की तुलना में कहीं तेज़ी से फैलेगा; data journalism से लेकर brand guidelines तक, कई क्षेत्रों में specialized agents बनाए जा सकते हैं (और MCP की token खपत व जटिल spec से बचा जा सकता है)

Skills की अवधारणा और संरचना

Anthropic ने 16 अक्टूबर 2025 को आधिकारिक तौर पर Claude Skills की घोषणा की
- यह फ़ोल्डर-आधारित capability extension system है, जिसमें मॉडल के लिए किसी खास काम (जैसे Excel का काम, या किसी संगठन की brand guidelines का पालन) से जुड़े निर्देश, scripts और resources रखे जाते हैं
- Claude केवल उसी समय उस skill तक पहुँचता है जब वह काम से संबंधित हो, जिससे specialized tasks करने की क्षमता बेहतर होती है
anthropic/skills GitHub repository में आधिकारिक skill examples उपलब्ध हैं
Skills वैचारिक रूप से बेहद सरल हैं
- इसकी core चीज़ एक Markdown file है, जो मॉडल को बताती है कि काम कैसे करना है
- वैकल्पिक रूप से इसमें अतिरिक्त documents और पहले से लिखी scripts शामिल हो सकती हैं, जो task completion में मदद करती हैं
सितंबर में घोषित Claude की document generation feature वास्तव में पूरी तरह Skills से implement की गई थी
- .pdf, .docx, .xlsx, .pptx files को process करने वाले skills, public repository में देखे जा सकते हैं

Token efficiency: Skills की मुख्य ताकत

Session शुरू होने पर Claude सभी available skill files को scan करता है और हर skill के frontmatter YAML से सिर्फ छोटा description पढ़ता है
हर skill के लिए शुरुआती token खपत सिर्फ कुछ दर्जन tokens की होती है, जो बेहद efficient है
पूरा detail तभी load होता है जब user ऐसा task माँगे जिसमें वह skill मदद कर सकता हो
यही वह मुख्य अंतर है जो इसे सिर्फ disk पर files रखने से आगे बढ़ाकर एक functional system बनाता है

Slack GIF बनाने वाले skill का व्यावहारिक उदाहरण

slack-gif-creator skill के metadata description में
- Slack के लिए optimized animated GIF generation toolkit
- size constraints validator और composable animation primitives शामिल हैं
- यह "X doing Y के बारे में Slack के लिए GIF बनाओ" जैसे requests पर लागू होता है
वास्तविक test process
- Claude mobile web app में Sonnet 4.5 model के साथ slack-gif-creator skill activate किया गया
- "Make me a gif for slack about how Skills are way cooler than MCPs" prompt डाला गया
- Claude ने अपने-आप GIF generate कर दिया (quality में सुधार की गुंजाइश है, लेकिन skill को बार-बार बेहतर बनाना आसान है)
Generate की गई Python script की उल्लेखनीय बातें
- Skill directory को Python path में जोड़ना: sys.path.insert(0, '/mnt/skills/examples/slack-gif-creator')
- Skill की core/ directory में मौजूद GIFBuilder class का उपयोग
- File को /mnt/user-data/outputs/ में save करना
- Slack size limit (2MB) validation function check_slack_size() का उपयोग कर specification compliance की जाँच
- Size ज़्यादा होने पर model अपने-आप छोटा file दोबारा generate करने की कोशिश कर सकता है

Skills की environment dependencies

Skills mechanism को पूरी तरह काम करने के लिए मॉडल को इन चीज़ों तक पहुँच होनी चाहिए
- filesystem
- filesystem exploration tools
- environment में commands execute करने की क्षमता
यह LLM tooling का एक सामान्य pattern है
- ChatGPT Code Interpreter इसका 2023 की शुरुआत का पहला बड़े पैमाने का उदाहरण था
- इसके बाद यह Cursor, Claude Code, Codex CLI, Gemini CLI जैसे coding agent tools के ज़रिए local machine तक फैला
यही requirement, MCP, ChatGPT Plugins जैसी पुरानी LLM capability extension कोशिशों से सबसे बड़ा अंतर है
यह एक अहम dependency है, लेकिन इसके ज़रिए खुलने वाली नई capabilities का पैमाना हैरान करने वाला है
Safety issues अब भी महत्वपूर्ण हैं
- सुरक्षित coding environment देना ज़रूरी है
- prompt injection जैसे हमलों से नुकसान को स्वीकार्य स्तर तक सीमित करने के लिए sandbox environment बनाने के तरीके चाहिए

Claude Code: general agent की ओर विकास

लेखक ने जनवरी 2025 में अनुमान लगाया था कि "agents" असफल होंगे, लेकिन यह पूरी तरह गलत साबित हुआ
- 2025 वास्तव में "agents" का साल बन गया (हालाँकि इसकी कई परिभाषाएँ हैं, यहाँ इसे "tools in a loop" के रूप में परिभाषित किया गया है)
Claude Code का नाम भ्रामक है
- यह सिर्फ coding tool नहीं, बल्कि general-purpose computer automation tool है
- कंप्यूटर पर command चलाकर हासिल किए जा सकने वाले हर तरह के काम को automate कर सकता है
- इसे general agent कहना सबसे उपयुक्त है
Skills इस संभावना को कहीं अधिक स्पष्ट और प्रत्यक्ष बना देता है
इसके applications चक्कर में डाल देने जितने व्यापक हैं
- data journalism उदाहरण: ऐसे skill folders बनाए जा सकते हैं जो इन कामों को संभालें
  - U.S. Census data के source और structure को समझना
  - अलग-अलग formats के data को Python libraries से SQLite/DuckDB में load करना
  - S3 के Parquet files या Datasette Cloud tables के रूप में data को online publish करना
  - नए datasets में दिलचस्प stories खोजने के तरीके (अनुभवी data reporters के निर्देश)
  - D3 का उपयोग कर साफ़, पढ़ने योग्य data visualizations बनाना
- नतीजा: सिर्फ Markdown files और कुछ Python script examples से U.S. Census data में stories ढूँढने और publish करने वाला "data journalism agent" बनाया जा सकता है

Skills vs MCP तुलना

Model Context Protocol (MCP) ने नवंबर 2024 में लॉन्च होने के बाद बहुत ज़्यादा ध्यान खींचा
- हर कंपनी को "AI strategy" चाहिए थी, और MCP implementation की घोषणा उस ज़रूरत को पूरा करने का आसान तरीका बन गई
MCP की सीमाएँ धीरे-धीरे सामने आने लगीं
- सबसे महत्वपूर्ण समस्या token usage है
- GitHub का official MCP अकेले ही कई दसियों हज़ार context tokens खा जाता है
- इसमें कुछ और जोड़ते ही LLM के पास असली उपयोगी काम करने के लिए बहुत कम जगह बचती है
Coding agents को गंभीरता से देखने के बाद लेखक की MCP में रुचि कम हो गई
- MCP से होने वाले लगभग हर काम को CLI tools से replace किया जा सकता है
- LLM को cli-tool --help कैसे चलाना है, यह पता होता है, इसलिए usage instructions पर बहुत tokens खर्च करने की ज़रूरत नहीं
- Model ज़रूरत पड़ने पर खुद समझ सकता है
Skills में यही फायदे मौजूद हैं, और इससे भी आगे
- नया CLI tool implement करने की भी ज़रूरत नहीं
- बस ऐसा Markdown file डालें जो बताए कि काम कैसे करना है
- अतिरिक्त scripts सिर्फ तभी जोड़ें जब वे reliability या efficiency बढ़ाएँ

Skills ecosystem के तेज़ी से बढ़ने की संभावना

Skills की सबसे दिलचस्प बातों में से एक है इसे share करना आसान होना
- उम्मीद है कि कई skills सिर्फ एक single file में implement हो जाएँगे
- ज़्यादा sophisticated skills, कुछ files वाले folder के रूप में होंगे
Anthropic द्वारा उपलब्ध कराए गए resources
- Agent Skills दस्तावेज़
- Claude Skills Cookbook
लेखक खुद भी Datasette plugin कैसे बनाएं जैसे skill ideas पर सोच रहे हैं
दूसरे models में भी इस्तेमाल संभव है: Skills design का एक और फायदा
- Skill folder को Codex CLI या Gemini CLI से जोड़कर "pdf/SKILL.md पढ़ो और इस project को समझाने वाला PDF बनाओ" कहें, तो यह काम कर सकता है
- भले ही उस tool या model को skill system का built-in ज्ञान न हो
अनुमान: इस साल के MCP rush को फीका कर देने वाला Skills का Cambrian explosion देखने को मिल सकता है

सादगी ही इसकी सबसे बड़ी ताकत है

कुछ लोगों का तर्क है कि Skills इतनी सरल है कि इसे feature कहना भी मुश्किल है
- बहुत से लोग पहले ही Markdown files में extra instructions डालकर coding agents से उन्हें पढ़वाने वाला trick आज़मा चुके हैं
- AGENTS.md एक अच्छी तरह स्थापित pattern है, और इसमें "PDF generate करने से पहले PDF.md पढ़ो" जैसे निर्देश रखे जा सकते हैं
Skills design की यही मूल सादगी लेखक को सबसे ज़्यादा उत्साहित करती है
MCP एक पूरा protocol specification है
- host, client, server, resources, prompts, tools, sampling, roots, elicitation
- और तीन transport methods शामिल हैं (stdio, streamable HTTP, पहले SSE)
Skills = Markdown + थोड़ा YAML metadata + optional executable scripts
- यह LLM की प्रकृति के कहीं ज़्यादा करीब है: text दो और model को उसे समझकर काम करने दो
Skills मुश्किल हिस्सों को LLM harness और उससे जुड़े computer environment को outsource करता है
- पिछले कुछ वर्षों में LLM की tool execution क्षमता के बारे में जो कुछ सीखा गया है, उसे देखते हुए यह बेहद समझदारी भरी रणनीति है

12 टिप्पणियां

shakespeares 2025-10-19

कोडिंग में Claude Code इस्तेमाल करते समय भी क्या यह जुड़ने लायक हिस्सा हो सकता है, ऐसा लगता है।
अभी भी मैं Claude.md में गाइड डालकर रखता हूँ, और डिटेल्ड गाइड को अलग-अलग बांटकर आगे बढ़ा रहा हूँ।

labeldock 2025-10-19

कम टोकन में ज़्यादा काम करने के लिए मुझे लगता है कि prompt optimization की बजाय multi-agent और summarization का इस्तेमाल करने वाला तरीका इसे काफ़ी सरलता से हल कर सकता है। समस्या पर मैं सहमत हूँ, लेकिन समाधान का तरीका सीमित लगता है।

savvykang 2025-10-18

क्या Skills भी tokens का उपयोग नहीं करते? अगर ऐसा है, तो लगता है कि token usage की समस्या फिर से आएगी, लेकिन उस समय इसका सामना कैसे करेंगे, यह मुझे ठीक से समझ नहीं आ रहा।

dnjstmxhs 2025-10-19

ऐसा लग रहा था कि context में पूरा SKILLS.md नहीं, बल्कि ऊपर की तरह सिर्फ नाम और description वाला हिस्सा ही हमेशा पहले शामिल होता है.

name: skill-creator
description: प्रभावी skills बनाने के लिए गाइड. इस skill का उपयोग तब किया जाना चाहिए जब users एक नया skill बनाना चाहते हों (या किसी मौजूदा skill को अपडेट करना चाहते हों) जो specialized knowledge, workflows, या tool integrations के साथ Claude की capabilities को बढ़ाता हो.
license: LICENSE.txt में पूरी शर्तें

ds2ilz 2025-10-18

Claude Code के साथ काम करते समय बार-बार निर्देश या नियमों को context में खिलाना पड़ता है, और आखिर में token usage और context के बीच संतुलन को लेकर सोचना पड़ता है। फिर मेरे मन में यह तरीका आया कि एक folder बनाया जाए, उसमें feature के हिसाब से अलग-अलग md files में विस्तृत बातें लिखी जाएँ, और claude.md में सिर्फ यह बताने वाले बहुत-से pointers रखे जाएँ कि क्या करना हो तो क्या देखना है। यह तरीका काफ़ी सस्ता और अच्छा चला। Skills भी आखिरकार ऐसे ही चीज़ों का संग्रह होगा, इसलिए यह काफ़ी काम का लग रहा है।

laeyoung 2025-10-19

और जैसा घोषणा की गई थी, अगर skills marketplace भी आ जाता है, तो ज़रूरत के skill ही लेकर उन्हें ज़रूरत पड़ने पर enable करके रखना काफ़ी ठीक लग रहा था।

shakespeares 2025-10-19

ओह, मुख्य व्याख्या के लिए धन्यवाद।

2025-10-18

[यह टिप्पणी छिपाई गई है.]