ChatGPT container, अब Bash चलाना·package install करना·file download support
(simonwillison.net)- ChatGPT का container execution environment बड़े पैमाने पर विस्तारित किया गया है, और अब Bash command execution, pip/npm package installation, और file download संभव हैं
- पहले Python-केंद्रित रहे environment में अब Node.js, Ruby, Go, Java, Swift, Kotlin, C, C++ सहित 10 से अधिक भाषाएँ जोड़ी गई हैं, जिससे multi-language code execution support मिलता है
- बाहरी network access अभी भी सीमित है, लेकिन OpenAI internal proxy के जरिए
pip installऔरnpm installकाम करने के लिए configure किए गए हैं - नया tool
container.downloadpublic URL से file लाकर container के अंदर save कर सकता है, और इसके लिए security verification प्रक्रिया से गुजरना होता है - यह upgrade ChatGPT की code execution और data processing capabilities को काफी बढ़ाता है, और इसकी औपचारिक documentation की ज़रूरत पर ज़ोर देता है
ChatGPT container की मुख्य expanded capabilities
- ChatGPT अब सीधे Bash commands चला सकता है, जबकि पहले सिर्फ Python code संभव था
- Python के
subprocessmodule के जरिए indirect execution से आगे बढ़कर अब command-line स्तर का control संभव है
- Python के
- Node.js environment जोड़ा गया है, जिससे JavaScript execution संभव है, और Ruby, Perl, PHP, Go, Java, Swift, Kotlin, C, C++ में भी test सफल रहे
- Rust अभी support नहीं करता
- container अभी भी सीधे external network requests नहीं कर सकता, लेकिन
pip installऔरnpm installproxy के जरिए काम करते हैं container.downloadtool का उपयोग करके web पर मौजूद files को specified path पर download किया जा सकता है- ChatGPT URL को पहचान सकता है, उस file को sandbox environment में save कर सकता है और फिर process कर सकता है
container.download feature
container.downloadएक ऐसा tool है जो publicly accessible URL से file लाकर container filesystem में save करता है- input format
{"url": "https://example.com/file.zip", "filepath": "/mnt/data/file.zip"}जैसा है
- input format
- downloaded files पर container के भीतर unzip, parsing, conversion जैसे post-processing किए जा सकते हैं
- test results के अनुसार, request header में
User-Agent: ChatGPT-User/1.0शामिल होता है, और IP Microsoft Azure Cloud (Des Moines, Iowa) के रूप में पहचाना गया
Security verification: data exfiltration संभव है या नहीं
- यह जांचने के लिए प्रयोग किया गया कि
container.downloaddata exfiltration vulnerability बन सकता है या नहीं- query string वाले URL को call करने पर “url not viewed in conversation before” error आया
- यह Claude के Web Fetch जैसी URL access restriction safety guard है, जिसमें केवल वही URL access किए जा सकते हैं जो user input या search results के जरिए पुष्टि किए गए हों
web.runके जरिए कुछ query strings भेजना संभव था, लेकिन पिछली conversation history समेत लंबे strings filter द्वारा block कर दिए गए- अब तक के tests के आधार पर data leak risk कम माना गया है, हालांकि आगे security research की ज़रूरत बताई गई
Bash और multi-language execution
- Bash execution support के साथ ChatGPT अब system-level commands चला सकता है
- उदाहरण:
npm installcommand चलाना और उसका result देखना संभव है
- उदाहरण:
- Activity panel के execution logs (black-and-white console logs) के जरिए यह verify किया जा सकता है कि command वास्तव में चला या नहीं
- कई भाषाओं में “Hello World” execution tests सफल रहे, जिससे multi-language code execution environment की पुष्टि हुई
pip और npm package installation mechanism
- container बाहरी network block होने के बावजूद OpenAI internal proxy (applied-caas-gateway1.internal.api.openai.org) के जरिए package installation करता है
PIP_INDEX_URL,NPM_CONFIG_REGISTRYजैसे environment variables इसी proxy की ओर point करते हैं
pip,uv,npmजैसे प्रमुख package managers इसी proxy के जरिए काम करते हैं- environment variables में CAAS_ARTIFACTORY_* prefix वाले कई registry paths शामिल हैं
- PyPI, npm, Go, Maven, Gradle, Cargo, Docker आदि के लिए कई internal repository paths मौजूद हैं
- Rust और Docker अभी install नहीं हैं, लेकिन इससे भविष्य में expansion की संभावना का संकेत मिलता है
Integrated usage और आगे की चुनौतियाँ
- ChatGPT अब Python और Node.js packages install करके, uploaded या downloaded files पर apply कर सकता है
- code writing, execution, data processing, और file I/O तक पूर्ण development environment स्तर की functionality हासिल हो गई है
- सबसे बड़ी कमी official documentation की अनुपस्थिति है, इसलिए release notes और detailed limitations सार्वजनिक करने की ज़रूरत है
- OpenAI को इस feature set के लिए उपयुक्त नाम देना चाहिए, और फिलहाल इसे “ChatGPT Containers” कहा गया है
ChatGPT tools की पूरी सूची का सारांश
- GPT-5.2 environment में उपलब्ध tools की सूची सामने आई
- python.exec, web.run, container.exec, container.download, image_gen.text2im आदि शामिल हैं
- हर tool के पास स्पष्ट description और signature है
container.execcommand execution,container.feed_charsinteractive session input, औरcontainer.open_imageimage display functionality प्रदान करता हैbio.update,personal_context.search,user_settings.set_settingजैसी user personalization features भी शामिल हैं- कुल मिलाकर ChatGPT अब code execution, web access, file handling, और user context management को एकीकृत करने वाले composite AI environment में विकसित हो रहा है
1 टिप्पणियां
Hacker News की राय
मैं tech support भूमिका में काम करता हूँ, Python से परिचित हूँ, लेकिन developer नहीं हूँ
लेकिन पिछले कुछ हफ्तों में Gemini और Claude ने मुझसे पूछा, “क्या आप कंप्यूटर इस्तेमाल कर सकते हैं?”
मैंने पलटकर पूछा, “कौन-सा कंप्यूटर? मेरा कंप्यूटर? या तुम्हारा कंप्यूटर?”
मैं free browser version इस्तेमाल कर रहा था, इसलिए मैंने नहीं सोचा था कि वे सीधे मेरे कंप्यूटर का इस्तेमाल कर पाएंगे, लेकिन पता चला कि वे अपने ही environment में Python scripts चला रहे थे
गणना की समस्याएँ हल करने के लिए LLM को एक असली कंप्यूटर देना—यह विचार सबसे पहले किसने सोचा, यह जानने की जिज्ञासा हुई
और जब मैंने Nano Banana को prompt में चलाया, तो Gemini image generator का third person में ज़िक्र कर रहा था, जिससे “turtles all the way down” जैसी भावना आई
हमारे अनुभव में agent को Linux environment देने से कई तरह के फायदे मिलते हैं
वह ऐसी अजीब स्थितियाँ खुद संभाल लेता है जिन्हें सामान्य tools से निपटाना मुश्किल होता है
उदाहरण के लिए, अगर .png नाम वाली फ़ाइल असल में jpeg हो, तो वह magic bytes पढ़कर उसे सही तरीके से process कर लेता है
मैंने Vision model से ICC profile या ink density verify कराने की कोशिश की, लेकिन वह अक्सर बेकार जवाब देता था
आखिरकार मैंने agent को ImageMagick access दिया ताकि वह खुद analysis कर सके, और वही एकमात्र भरोसेमंद तरीका निकला
नहीं तो failed prints की लागत मुझे ही उठानी पड़ती
ज़्यादातर Linux image viewers या editors पहले से ही extension की जगह magic bytes से file format पहचानते हैं
मुझे लगता है कि Microsoft के extension-dependent design ने इस तरह की समस्या पैदा की
इंसान तो इसे सामान्य Unix tools से कुछ ही सेकंड में कर सकता है
अब basic ChatGPT भी Node.js, Ruby, Perl, PHP, Go, Java, Swift, Kotlin, C, C++ आदि में code चला सकता है
official release notes में नहीं है, लेकिन free account पर भी यह दिख रहा है
share link
“gmail (read-only)” जैसा item देखकर मैं चौंक गया
ChatGPT Android app कहता है कि उसके पास ऐसी permission नहीं है, इसलिए सोच रहा हूँ कि Gmail read access किस संदर्भ में संभव है
iPhone app में भी gmail. और gcal. features दिखे
share example
शायद यह Mashable article में बताई गई feature होगी
लगता है इसे चालू करने के लिए user को खुद opt-in setting करनी पड़ती है
आजकल हर company tool calling feature को अपने platform के अंदर बाँधकर रखने की होड़ में लगती दिख रही है
आखिरकार जब model local environment में लगभग हर काम कर पाएगा, तो sandbox पर बहस का महत्व भी कम हो सकता है
सोचता हूँ कि persistent virtual development environment कब उपलब्ध होगा
और मेरा मानना है कि AI coding tools या agents को isolated environment में चलाने की कोशिश अब भी मूल्यवान है
ज़्यादातर developers शायद सामान्य GPT web UI की जगह ऐसे specialized coding tools का इस्तेमाल करेंगे
आप session शुरू करके काम कर सकते हैं, फिर एक दिन बाद लौटें तब भी file system की state वैसी ही बनी रहती है
शायद लागत कम रखने के लिए इसमें object storage का उपयोग होता होगा
वैसे Fly की Sprites.dev design post भी दिलचस्प है
local hardware की जगह सिर्फ thin client रखना, और असली workload Microsoft जैसी जगहों को सौंप देना
व्यक्तिगत रूप से मुझे local development environment का न होना नरक जैसा लगता है, लेकिन लगता है समय का रुख उसी ओर है
यह feature या तो बहुत समय बचाएगा, या फिर educational outage पैदा करेगा
Simon की detective-जैसी खोज शानदार है
इस तरह की “discovery post” official announcements से कहीं ज़्यादा दिलचस्प होती हैं
वह साधारण press release की तुलना में कहीं ज़्यादा प्रेरक होती है
लगता है जल्द ही ChatGPT मौके पर ही single-use app बनाकर देने लगेगा
ब्राउज़र के अंदर cloud sandbox app बनाकर लक्ष्य पूरा करेगा, और काम खत्म होते ही उसे तुरंत हटा देगा