- Chrome DevTools MCP सर्वर को इस तरह बेहतर बनाया गया है कि coding agents active browser session से सीधे connect कर सकें
- इस फीचर के जरिए agent logged-in session को reuse कर सकते हैं या DevTools की active debugging session तक पहुंच सकते हैं
- Chrome M144 (beta) में
--autoConnect option इस्तेमाल करने पर MCP सर्वर चल रहे Chrome instance से अपने-आप connect हो जाता है
- हर connection पर user approval dialog दिखाया जाता है, और debugging के दौरान “स्वचालित टेस्ट सॉफ़्टवेयर द्वारा नियंत्रित” बैनर दिखता है
- manual debugging और AI-assisted debugging के बीच आसानी से switch किया जा सकता है, जिससे development efficiency बढ़ती है
Chrome DevTools MCP सर्वर सुधार का अवलोकन
- Chrome DevTools MCP सर्वर को update किया गया है ताकि coding agents active browser session से सीधे connect कर सकें
- user logged-in session को reuse कर सकता है, इसलिए बिना अतिरिक्त login के debugging संभव है
- DevTools UI के Network panel या Elements panel में चुनी गई items की जांच agent से कराई जा सकती है
- मौजूदा connection methods भी बने रहते हैं, जिनमें MCP सर्वर के लिए dedicated profile का उपयोग, remote debug port connection, और temporary profile आधारित multiple instance execution शामिल हैं
यह कैसे काम करता है (How it works)
- Chrome M144 (फिलहाल beta) में remote debugging connection request feature जोड़ा गया है
- जब MCP सर्वर
--autoConnect option के साथ चलता है, तो यह active Chrome instance से अपने-आप connect होकर remote debugging session request करता है
- security मजबूत करने के लिए Chrome हर request पर user approval dialog दिखाता है, और approval के बाद ही connection की अनुमति देता है
- debugging session सक्रिय होने पर browser के ऊपर “Chrome is being controlled by automated test software” बैनर दिखता है
शुरू करें (Get started)
- नए remote debugging feature का उपयोग करने के लिए Chrome में remote debugging enable करना होगा और MCP सर्वर सेट करना होगा
Step 1: Chrome में remote debugging सेट करें
chrome://inspect/#remote-debugging पर जाकर remote debugging enable करें
- dialog के जरिए debugging connection की अनुमति देनी है या नहीं, यह चुनें
Step 2: MCP सर्वर auto-connect सेट करें
chrome-devtools-mcp सर्वर चलाते समय --autoConnect argument जोड़ें
- उदाहरण configuration (gemini-cli):
{
"mcpServers": {
"chrome-devtools": {
"command": "npx",
"args": [
"chrome-devtools-mcp@latest",
"--autoConnect",
"--channel=beta"
]
}
}
}
- Chrome M144 के stable channel तक पहुंचने से पहले
--channel=beta देना जरूरी है
Step 3: सेटअप टेस्ट करें
coding agents के साथ integrated debugging
- active Chrome instance connection के जरिए automation और manual control साथ-साथ इस्तेमाल किए जा सकते हैं
- user DevTools में problem element खोजने के बाद उस element को coding agent को देकर fix करने को कह सकता है
- Network panel में भी इसी तरह request चुनकर agent को analysis के लिए कहा जा सकता है
- Chrome DevTools MCP सर्वर के जरिए अतिरिक्त panel data access को धीरे-धीरे बढ़ाने की योजना है
1 टिप्पणियां
Hacker News की राय
मैं Playwright का इस्तेमाल करके सभी requests और responses को intercept करता हूँ, और जब Claude Code YouTube जैसी वेबसाइटों पर navigate करते हुए click और input करता है, तब उससे जुड़ा traffic रिकॉर्ड करता हूँ
इस तरह इकट्ठा किए गए डेटा के आधार पर strongly-typed API अपने-आप generate करता हूँ, ताकि किसी भी वेबसाइट के साथ internal API के ज़रिए interact किया जा सके
बेशक यह सेवा की शर्तों का उल्लंघन हो सकता है, लेकिन फायदा यह है कि ads, images, या markup सब कुछ लोड नहीं करना पड़ता
अगर किसी की दिलचस्पी हो तो इसे इस हफ्ते public करने की योजना है
असल में Anthropic या OpenAI जैसी LLM बनाने वाली कंपनियाँ यही तरीका पहले से अपनाती रही हैं
जब वे ads को bypass करती हैं या copyrighted सामग्री डाउनलोड करती हैं, तो उसे ‘ईश्वर का उपहार’ कहा जाता है, और जब Zuck वही काम करे तो ‘शैतान का श्राप’ — यही विडंबना है
ज़्यादातर DOM tree के खास points पर page layout और styles को recreate करने, या responsive behavior को अपने-आप capture करने के लिए
Playwright से screen width बदलते हुए style changes को track करता हूँ, और screenshots और style hierarchy data को साथ में सेव करता हूँ
manual inspection tools भी हैं, लेकिन वे बहुत धीमे और अप्रभावी हैं
मेरी राय में MCP से बेहतर है कि custom CLI सीधे खुद बनाई जाए
AI का सीधे access करना और ‘skills’ के ज़रिए उसका इस्तेमाल करना ही असली ताकत है
लगता है Claude के पास सिर्फ agent-browser हो तो वह deterministic code सीधे generate कर सकता है
DevTools MCP project ने हाल ही में standalone CLI जारी की है
chrome-devtools-cli डॉक्युमेंट देखें तो यह v0.20.0 version में शामिल है
MCP की token cost समस्या को लेकर चिंतित लोगों के लिए यह अच्छी खबर है
(जानकारी के लिए, मैं पहले DevTools टीम में काम करता था, और अब भी वहीं काम कर रहा हूँ)
मैं पिछले कुछ महीनों से TideWave इस्तेमाल कर रहा हूँ
tidewave.ai पहले Elixir/LiveView आधारित था, लेकिन अब JS frameworks और RoR भी support करता है
यह टूल सिर्फ browser तक सीमित नहीं है, बल्कि app के runtime access तक देता है
यानी agent सीधे database और endpoints तक पहुँच सकता है, इसलिए यह बहुत ताकतवर है
Google agentic CLI coding में बहुत पीछे है
Gemini CLI इतनी खराब है कि साफ़ लगता है कि अंदरूनी तौर पर भी इसका इस्तेमाल नहीं होता
मुझे लगता है MCP पहले ही dead technology बन चुकी है। CLI tools ज़्यादा तेज़, flexible हैं, और पहले से trained environments भी बहुत हैं
किसी serious developer के लिए Playwright और headless Chromium इस्तेमाल करना ही सही तरीका है
MCP सिर्फ beginners को आकर्षित करती है
सिर्फ CLI से security और operations की complexity बहुत बढ़ जाती है
हाँ, Gemini CLI के खराब होने वाली बात से मैं सहमत हूँ
Anthropic ने इसे बेहतर करने की कोशिश की, लेकिन context bloat की समस्या अब भी बनी हुई है
MCP servers इस्तेमाल न होने पर भी context घेरते हैं
अब agent skill की तरफ़ जाना चाहिए
code search, docs access, bug lookup, RAG database connections जैसी चीज़ों के लिए MCP services इस्तेमाल की जाती हैं
(यह बात मैंने सीधे Google के अंदर काम करने वालों से सुनी है)
और अगर MCP context लेती है, तो क्या CLI skills मुफ़्त हैं — यह भी सवाल है
यह सुविधा पहले से implement करने वाली एक agent skill मौजूद है
chrome-cdp-skill मैं रोज़ इस्तेमाल करता हूँ और यह सच में कमाल की है
उदाहरण के लिए, codex से local music library manage करते समय मैं YT Music tab खोलकर album खोज सका और URL को yt-dlp को दे सका
हालाँकि अभी यह सिर्फ Chrome के लिए है, इसलिए दूसरे browsers के लिए binary path बदलना पड़ता है
browser automation + agent क्षेत्र में पहले से कड़ी प्रतिस्पर्धा है
DevTools MCP और नई CLI को Chrome DevTools & Puppeteer टीम maintain करती है, इसलिए शायद यह ज़्यादा स्थिर होगी
फिर भी यह अच्छी बात है कि open source competition innovation लाती है
मेरे हिसाब से playwriter.dev जैसे stable tool का इस्तेमाल करना बेहतर है
मैंने WebSocket proxy + Chrome extension बनाया है ताकि agent DOM को control कर सके
browserbox के ज़रिए इसे इस तरह सेट किया है कि session cookies की अनुमति के साथ access मिल सके
अभी इसे agent tool usage success rate बढ़ाने के लिए research middleware की तरह इस्तेमाल कर रहा हूँ
मैं यह MCP काफी समय से इस्तेमाल कर रहा हूँ, और codex on opencode के साथ यह सबसे ज़्यादा stable लगा
खासकर SVG editing REPL के रूप में इस्तेमाल करने पर इसने अपने-आप शानदार custom icons बना दिए, जो काफ़ी चौंकाने वाला था
Electron apps में भी यह reverse engineering या extension work के लिए अच्छी तरह फिट बैठता है
मैंने playwriter इस्तेमाल किया था, और existing session से connect करने का इसका तरीका हैरान कर देने जितना अच्छा चला
मैंने भी Playwright के साथ कुछ ऐसा ही बनाया था
पहले token usage बहुत ज़्यादा होने से cost भी काफी आती थी, लेकिन results को disk पर save करके और agent से query करवाने वाला एक wrapper बनाकर इसे हल किया
uisnap.dev पर देखा जा सकता है
जानना चाहूँगा कि क्या इस project ने token usage समस्या हल कर दी है
playwright-slim-mcp पर देखा जा सकता है
मैंने firefox-devtools-mcp इस्तेमाल किया, और यह बेसिक Chrome MCP से कहीं ज़्यादा तेज़ और efficient लगा