MCP: एक (संयोगवश) सार्वभौमिक प्लगइन सिस्टम
(worksonmymachine.substack.com)- USB-C की अहमियत सिर्फ चार्जिंग या फ़ाइल ट्रांसफ़र तक सीमित नहीं है, बल्कि इसकी सार्वभौमिकता में है, जो इसे कई तरह के उपयोगों तक फैलने देती है
- MCP(Model Context Protocol) मूल रूप से AI assistants के लिए डिज़ाइन किया गया था, लेकिन व्यवहार में यह सभी data sources और tools को जोड़ने वाला एक सार्वभौमिक plugin system बन सकता है
- NFT Base64 के उदाहरण की तरह, कोई protocol अपने मूल उद्देश्य से आगे बढ़कर वास्तविक दुनिया के data को सीधे store और use करने के तरीके में विस्तारित हो सकता है
- MCP servers जितने बढ़ेंगे, उतना ही हर app बिना अलग integration के विविध features आसानी से इस्तेमाल कर सकेगा
- USB-C की तरह MCP भी 'किसी भी चीज़ को जोड़ सकने वाली संभावनाओं की जगह' बन सकता है, जो अनपेक्षित innovation की नींव रखेगा
MCP: An (Accidentally) Universal Plugin System (Or: The Day My Toaster Started Taking Phone Calls)
USB-C और अप्रत्याशित सार्वभौमिकता
- USB-C को सब लोग चार्जिंग या फ़ाइल ट्रांसफ़र के लिए ही समझते थे, लेकिन उसकी बनावट की वजह से यह कई तरह के उपयोगों तक फैल सकता है
- लेखक के दोस्त Rex ने एक toaster को monitor से जोड़ दिया, जिससे toaster में HDMI output की क्षमता आ गई; यह USB-C की असीम संभावनाओं को दिखाता है
- ऐसा इसलिए संभव है क्योंकि USB-C की संरचना ऐसी है कि power और data specs की ज़्यादा परवाह किए बिना, अगर connector फिट हो जाए तो लगभग कुछ भी जोड़ा जा सकता है
कार cigarette lighter socket का सिद्धांत
- कार का cigarette lighter socket मूल रूप से सिगरेट जलाने के लिए था, लेकिन अब यह एक तरह के universal power port के रूप में इस्तेमाल होता है
- इस socket की तरह protocols भी उपयोगकर्ता की पसंद को सीमित नहीं करते, बल्कि कई तरह के उपयोगों की अनुमति देते हैं
- MCP में भी ऐसी ही विस्तार क्षमता है
MCP की फिर से खोज: संयोग से एक सार्वभौमिक प्लगइन सिस्टम
- आम तौर पर MCP(Model Context Protocol) को AI assistants (जैसे Claude) के लिए data इस्तेमाल कराने वाले माध्यम के रूप में जाना जाता है
- आधिकारिक दस्तावेज़ों में भी लिखा है कि यह “AI models को कई data sources और tools से standard तरीके से जोड़ता है”
- लेकिन अगर इसमें से AI वाला हिस्सा हटा दें, तो MCP “किसी भी चीज़ को अलग-अलग data sources और tools से जोड़ने” का माध्यम बन जाता है
- यानी यह अपने शुरुआती उद्देश्य से परे एक universal connection protocol बन सकता है
The NFT Base64 Revelation
- NFT मूल रूप से images को refer करने के लिए था, लेकिन एक समय ऐसा आया जब वही reference खुद data बन गया
- protocol का मूल आशय बदलते-बदलते library card ही असली किताब की भूमिका निभाने लगा
- यह मूल इरादे से कहीं अधिक व्यापक, वास्तविक दुनिया के data को सीधे संभालने वाला tool बन गया
ऐसा network effect जिसकी किसी ने कल्पना नहीं की थी
- जैसे-जैसे AI के लिए MCP servers बढ़ेंगे, वैसे-वैसे बिना अलग development के हर app नए features हासिल कर सकेगा
- उदाहरण के लिए, अगर कोई Spotify MCP server बना दे, तो एक workout app MCP के ज़रिए अपने-आप playlist बना सकेगा
- एक-दूसरे को न जानने वाले developers और apps स्वाभाविक रूप से जुड़ जाएंगे, और इससे सबको फायदा देने वाला network effect पैदा होगा
- हर MCP server को एक universal plugin की तरह दोबारा इस्तेमाल किया जा सकेगा
- किसी ने इसकी योजना नहीं बनाई, फिर भी संयोग से एक universal plugin ecosystem बन जाएगा
USB-C का मतलब और MCP का दर्शन
- MCP की तुलना अक्सर AI के USB-C से की जाती है, लेकिन USB-C की असली खासियत सिर्फ एक साधारण port होना नहीं, बल्कि किसी भी चीज़ को जोड़ सकने वाली संभावनाओं की जगह होना है
- जैसे USB-C power, data, video और दूसरी अज्ञात क्षमताओं को स्वीकार करता है, वैसे ही MCP भी सिर्फ 'AI के लिए' नहीं, बल्कि 'functions के लिए एक अच्छी तरह से डिज़ाइन किया गया छेद' है, जिससे कोई भी किसी भी functionality को जोड़ सकता है
अब वह हिस्सा जहाँ मैं बताता हूँ कि मैं क्या बना रहा हूँ
- लेखक APM(Actions Per Minute) नाम का एक task management app बना रहा है
- APM अपने plugin system के लिए पूरी तरह सिर्फ MCP servers का इस्तेमाल करता है
- उपयोगकर्ता जब भी कोई नया feature जोड़ना चाहें, उन्हें सिर्फ एक MCP server connect करना होगा (जैसे spell check, coffee auto-ordering, game character reactions आदि)
- इससे app खुद लचीला और कई रूप लेने वाला बन जाता है
The Toaster Protocol Principle
- सभी महान protocols शुरू में जिस काम के लिए बनाए जाते हैं, उससे अलग अनपेक्षित उपयोगों में जाकर innovation पैदा करते हैं
- HTTP: academic papers → civilization infrastructure
- Bluetooth: hands-free → main door unlock करना आदि
- USB: input devices → portable fan charging आदि
- MCP भी मूल रूप से AI context पहुँचाने के लिए बना था, लेकिन अपने सार में यह हर चीज़ को हर चीज़ से जोड़ने वाला protocol है
- यह plugin ecosystem की वह नींव है जो अप्रत्याशित innovation को जन्म दे सकती है
- यह शायद कभी इरादतन नहीं था, लेकिन toaster और monitor को HDMI से जोड़ने वाले युग के लिए बिल्कुल उपयुक्त है
समापन
- PS: अगर आप MCP server की मदद से ऐसी computer बना दें जिससे ताज़ी ब्रेड की खुशबू आए, तो ज़रूर संपर्क करें
- PPS: APM early access खुल चुका है, और अनोखे प्रयासों तथा रचनात्मक प्रयोगों को प्रोत्साहित किया जा रहा है
- (कहीं न कहीं कोई protocol अब भी अपने मूल उद्देश्य के मुताबिक इस्तेमाल हो रहा है। यह काफ़ी संदिग्ध लगता है)
4 टिप्पणियां
MCP सर्वर के responses में अक्सर कोई तय schema नहीं होता, और वे natural language में होते हैं.
इस natural language response को LLM के बिना programmatically process करना मुश्किल होगा.
जानकारी के लिए, mcp 2025-06-18 स्पेसिफिकेशन में नया structured tool output जोड़ा गया है, जिससे response schema को describe करना संभव हो गया है। जैसा आपने कहा, अभी तक implement किए गए ज़्यादातर mcp tools unstructured होंगे, लेकिन आगे आने वाले mcp tools से काफ़ी उम्मीद की जा सकती है।
विंटर-निम, आपसे यहाँ फिर मुलाकात हो गई, हाहा
मैं 250618 स्पेक को फॉलो-अप नहीं कर पा रहा था। धन्यवाद!
Hacker News राय
मुझे यह लेख और MCP प्रोटोकॉल सच में बहुत पसंद आया। लेकिन MCP को देखते ही मुझे किसी वजह से microservices और SOA की याद आती है। डर लगता है कि कहीं यह नए failure points पैदा करने वाला वही पुराना दुःस्वप्न फिर न बन जाए। दूसरी तरफ, यह उम्मीद भी है कि agents के आने से reliability बेहतर करना शायद अधिक स्वाभाविक हो जाए
मैं लेख की सोच से सहमत हूँ, और लेखक MCP का इस्तेमाल जिस तरह से कर रहा है, वह थोड़ा हटकर होने के बावजूद काफ़ी दिलचस्प है। इस विचार का असली सार यह नहीं है कि कोई ऐसा protocol आ गया है जो पहले कभी न हुई नई चीज़ें संभव बनाता है। सच कहें तो, दूसरे comments की तरह, MCP अपने-आप में कोई बहुत नई या रोमांचक idea नहीं है। असली दिलचस्प बात यह है कि AI agent लहर की वजह से interoperability पर ध्यान गया है, और vendor lock-in को अब पुराने ज़माने की समस्या की तरह देखा जा रहा है। यह माहौल कितने समय तक रहेगा, पता नहीं, लेकिन अभी के लिए अच्छा लग रहा है
लेखक MCP की universality को लेकर बहुत उत्साहित है, लेकिन ईमानदारी से कहूँ तो समझ नहीं आता कि यह API के विचार से मूलतः कितना अलग है। MCP की जगह REST लिख दें, तो क्या लेख का मतलब बहुत बदलेगा? OS APIs, POSIX, और Unix pipes से भी इसकी समानता दिखती है। हाँ, MCP इन सबसे कहीं अधिक simple और generic है। लेकिन क्या असली समाधान हर बार नया abstraction बनाना है, या फिर बुनियादी तौर पर सरल software बनाना?
list-toolscommand है। REST APIs में resources को list करने के कई तरीके होते हैं, लेकिन MCP एक ही standardized तरीका देता हैMCP को लेकर बहुत लोग कहते हैं कि यह कमाल की चीज़ है, लेकिन मैंने अब तक बहुत कम ऐसे उदाहरण देखे हैं जहाँ इससे वाक़ई कुछ शानदार बना हो। थोड़ा वैसा ही एहसास है जैसा blockchain hype के समय था। आख़िर में MCP भी शायद AI के और smarter होने तक का एक अस्थायी उपाय ही निकले। दो साल बाद शायद MCP की जगह tools के docs या OpenAPI को सीधे दे दिया जाएगा और AI पूरा context खुद समझ लेगा
मुझे लगता है Microsoft की पुरानी “Embrace, Expand, Extinguish” रणनीति यहाँ भी काम कर रही है। system stability और security के नाम पर, अगर agents बिना किसी management के tools को dynamically discover करें तो conflicts का जोखिम बढ़ता है। PydanitcAI जैसे alternatives हैं, लेकिन आख़िरकार Microsoft ने MCP को ‘Build 2025’ में आधिकारिक रूप से push करके अपनी रफ़्तार पर industry को चलाना शुरू कर दिया है। Anthropic ने ऐसा standard जारी किया जिसमें tools कमज़ोर हैं और governance की कमी है, इसलिए Microsoft के लिए उसे कब्ज़े में लेना आसान बनता है। अगला चरण शायद यह हो कि Microsoft अपनी registry को industry standard बना दे और उसे Windows-specific commands के साथ जोड़ दे। आख़िर में “security” के मानक भी अपने फ़ायदे के हिसाब से तय कर दे और rivals को किनारे कर दे
अगर AI वाला हिस्सा पूरी तरह हटा दें तो? चिंता यह है कि अगर AI middleware के बिना सीधे MCP servers पर निर्भर हुआ जाए, तो तुरंत backward compatibility की समस्या सामने आ सकती है। क्योंकि MCP servers मानकर चलते हैं कि caller एक AI algorithm है, इसलिए tools या input/output schemas पर आधारित breaking changes कभी भी आ सकते हैं
मैंने भी ऐसा ही सोचा था, लेकिन फिर लगा कि ज़्यादातर MCP servers शायद मौजूदा APIs के लिए बस नए clients ही हैं। उदाहरण के लिए Kagi MCP server सिर्फ़ Kagi API को call करता है। तो फिर क्या API को सीधे इस्तेमाल करना बेहतर नहीं होगा? और system में MCP servers की संख्या के हिसाब से Python interpreters बढ़ते जाएँगे—तो क्या आगे कोई ऐसा “hosting” service आएगा जो इन्हें इकट्ठा करके एक साथ bridge कर दे?
/list-toolsendpoint और जोड़ने जैसा है। हर client पहले/list-toolsपर जाकर available tools की list लाता है, और फिर आगे individual APIs को call करता हैcurlcommands चलानी थीं। अगर OpenAPI spec काफ़ी अच्छी हो, तो MCP ज़रूरी न भी हो सकता है। हाँ, अगर मौजूदा API ही न हो, तो शायद MCP server खुद core behavior को implement करने की दिशा में विकसित हो सकता हैcomments में skepticism काफ़ी है, और मैं उससे सहमत हूँ। मैंने पिछले हफ़्ते खुद एक MCP server implement किया था, और ईमानदारी से कहूँ तो इसे “well-designed” कहना कुछ ज़्यादा ही तारीफ़ होगी। MCP के लक्ष्यों में से एक यह है कि इसे “आसान बनाया जाए”, लेकिन व्यवहार में यह उतना आसान नहीं है। फिर भी महत्वपूर्ण बात यह है कि इस समय बहुत सारे developers की नज़र एक ही दिशा में है। ऐसे momentum में समस्याओं के हल बहुत तेज़ी से आ सकते हैं। साथ ही किसी ecosystem के बनने के लिए एक critical mass चाहिए होती है, और लगता है कि वह inflection point सच में आ गया है। सबको patience और good luck मिले
यह बात ज़ोर देकर कहने लायक है कि technology adoption और diffusion के लिए entry barrier कम करना इतिहास भर में बहुत महत्वपूर्ण रहा है। MCP भी उसी परंपरा का हिस्सा है, और इसे नज़रअंदाज़ नहीं किया जाना चाहिए। हमारी team में भी, जिसका कोई technical background नहीं था, वह file-sharing tasks को automate करने वाले agent का इस्तेमाल खुद कर पाया। पहले यह काम सैकड़ों programming languages, libraries और APIs के ज़रिए ही संभव था, लेकिन MCP की वजह से अब non-specialists भी बिना उन सबकी चिंता किए सीधे समाधान पा सकते हैं। performance के लिहाज़ से यह सबसे बेहतरीन नहीं है, और implementation भी optimal नहीं है, लेकिन यह नया तरीका जो value ला रहा है, वह मौजूदा resources और technology level पर अभूतपूर्व है। असली बात वही है
“काश AI agent Warcraft 3 में peon की तरह आदेश ले और जवाब दे” वाला मज़ाक—मेरे लिए तो जवाब होगा कि मैं तो sailing करना पसंद करूँगा