OpenAI ने macOS के लिए Codex ऐप पेश किया
(openai.com)- कई AI agents को एक साथ मैनेज करने वाला AI development integrated environment, जो parallel work और long-term collaboration को सपोर्ट करता है
- हर agent एक स्वतंत्र thread में चलता है, जिससे project-wise multitasking, code review, diff comments और manual edits संभव होते हैं
- Skills फीचर के ज़रिए यह सिर्फ code writing तक सीमित नहीं रहता, बल्कि information gathering, problem solving, image generation, document creation और cloud deployment जैसे कामों तक फैलता है
- Automations फीचर से तय schedule के अनुसार background में repetitive tasks अपने-आप चलाए जा सकते हैं
- डिफ़ॉल्ट रूप से sandbox security लागू होती है, और network access जैसी ऊँचे अधिकार वाली commands के लिए user approval चाहिए
- ChatGPT Free और Go users के लिए भी सीमित समय तक Codex उपलब्ध, और paid plans में usage limit 2x बढ़ाई गई
Codex ऐप का परिचय: agents के लिए command center
- अप्रैल 2025 में Codex लॉन्च होने के बाद developers के agents इस्तेमाल करने का तरीका बुनियादी रूप से बदल गया
- अब model जटिल और लंबे समय तक चलने वाले tasks को शुरू से अंत तक संभाल सकता है
- developers अब कई agents को पूरे project में coordinate करके काम delegate कर सकते हैं और parallel execution करा सकते हैं
- मुख्य चुनौती अब "agent क्या कर सकता है" से बदलकर "इंसान बड़े पैमाने पर agents को कैसे निर्देशित, supervise और collaborate कर सकता है" पर आ गई है
- मौजूदा IDE और terminal-आधारित tools इस तरह के workflow को सपोर्ट करने के लिए डिज़ाइन नहीं किए गए थे, इसलिए नए tool की ज़रूरत थी
- macOS के लिए Codex ऐप कई AI agents को एक साथ मैनेज कर सकता है और parallel में tasks चला सकता है
- यह long-running tasks को सपोर्ट करता है और agents के बीच collaboration के माध्यम से software design, development, deployment और maintenance की पूरी प्रक्रिया मैनेज कर सकता है
multi-agent parallel work
- Codex ऐप agents के साथ multitasking के लिए एक focused space देता है
- agents project के हिसाब से अलग separate threads में चलते हैं, जिससे context खोए बिना tasks के बीच switch किया जा सकता है
- thread के अंदर agent के changes review किए जा सकते हैं, diff पर comments जोड़े जा सकते हैं, या editor में सीधे edits किए जा सकते हैं
- Worktrees का built-in support कई agents को एक ही repository में बिना conflict के काम करने देता है
- हर agent code की isolated copy पर काम करता है, इसलिए local git state को प्रभावित किए बिना अलग-अलग रास्ते explore किए जा सकते हैं
- agent के काम के दौरान changes को local में checkout किया जा सकता है, या local git state बदले बिना काम जारी रखा जा सकता है
- Codex CLI और IDE extension से session history और settings अपने-आप import हो जाते हैं, इसलिए मौजूदा project में तुरंत इस्तेमाल संभव है
Skills: code generation से आगे का विस्तार
- Codex अब code लिखने वाले agent से आगे बढ़कर code का इस्तेमाल करके computer पर काम करने वाले agent में विकसित हो रहा है
- Skills के ज़रिए इसे information gathering, synthesis, problem solving और writing जैसे code generation से आगे के कामों तक बढ़ाया जा सकता है
- instructions, resources और scripts को bundle करके Codex tools से connect कर सकता है और workflows चला सकता है
- टीम की preferences के अनुसार काम को भरोसेमंद तरीके से पूरा किया जा सकता है
- Codex ऐप में Skills बनाने और मैनेज करने के लिए dedicated interface शामिल है
- किसी खास Skill के इस्तेमाल को explicitly request किया जा सकता है, या task के हिसाब से उसे अपने-आप इस्तेमाल करने के लिए सेट किया जा सकता है
-
Skills उपयोग का उदाहरण: racing game बनाना
- Codex से अलग-अलग racers, 8 maps और spacebar से इस्तेमाल होने वाले items वाला racing game बनाने को कहा गया
- image generation skill (GPT Image आधारित) और web game development skill का इस्तेमाल किया गया
- एक ही शुरुआती prompt से इसने 7 million से अधिक tokens पर स्वतंत्र रूप से काम करके game पूरा किया
- इसने designer, game developer और QA tester की भूमिका निभाते हुए वास्तव में game खेलकर उसे verify भी किया
- game का नाम: Voxel Velocity, Three.js का इस्तेमाल करने वाला 3D voxel kart racer
- single race mode (हमेशा 3 laps, 1 human vs 7 CPU, 8 tracks तुरंत उपलब्ध)
- arcade driving model, drift charge system, boost tiers (Tier 1 0.7 सेकंड, Tier 2 1.1 सेकंड, Tier 3 1.5 सेकंड)
- 8 characters, 8 items, CPU difficulty presets, AI spline implementation
- Codex से अलग-अलग racers, 8 maps और spacebar से इस्तेमाल होने वाले items वाला racing game बनाने को कहा गया
-
उपलब्ध प्रमुख Skills
- Implement designs: Figma से design context, assets और screenshots लाकर 1:1 visual fidelity वाली production UI code में बदलना
- Manage projects: Linear में bug triage, release tracking और team workload management
- Deploy to the cloud: Cloudflare, Netlify, Render, Vercel जैसे प्रमुख cloud hosts पर web apps deploy करना
- Generate images: GPT Image आधारित image generation skill से websites, UI mockups, product visuals और game assets के लिए images बनाना और edit करना
- Build with OpenAI APIs: OpenAI API के साथ build करते समय latest documentation का संदर्भ लेना
- Create documents: PDF, spreadsheet और docx files को पढ़ना, बनाना और edit करना (professional formatting और layout support सहित)
- ऐप में नई skill बनाने पर वह app, CLI और IDE extension हर जगह इस्तेमाल की जा सकती है
- skills को repository में check-in करके पूरी टीम के साथ share किया जा सकता है
Automations: repetitive tasks का automation
- Automations फीचर के ज़रिए Codex तय schedule के अनुसार background में अपने-आप tasks चलाता है
- इसे instructions और optional skills को मिलाकर configure किया जाता है
- पूरा होने पर results review queue में सेव होते हैं, ताकि ज़रूरत पड़ने पर आगे काम जारी रखा जा सके
- OpenAI के अंदरूनी उपयोग के उदाहरण
- daily issue triage
- CI failures ढूँढना और summarize करना
- daily release brief बनाना
- bug verification
Personality: काम करने की शैली को customize करना
- हर developer की agents के साथ काम करने की पसंद अलग होती है
- कुछ लोग concise और action-oriented partner चाहते हैं
- कुछ लोग ज़्यादा conversational और empathetic interaction पसंद करते हैं
- Codex में दो तरह की personality चुनी जा सकती हैं: concise और practical style बनाम conversational और empathetic style
- functionality बदले बिना इसे पसंदीदा working style के अनुसार ढाला जा सकता है
- app, CLI और IDE extension में /personality command से इसे सेट किया जा सकता है
सुरक्षा: डिफ़ॉल्ट रूप से लागू और configurable
- Codex agent stack के पूरे ढाँचे में design stage से ही security integrated है
- Codex CLI की तरह यह native, open source, configurable system-level sandboxing का इस्तेमाल करता है
- default settings
- agents को सिर्फ काम कर रहे folder या branch की files edit करने और cached web search करने की अनुमति होती है
- network access जैसी ऊँचे अधिकार वाली commands चलाने पर user approval माँगा जाता है
- project या team rules configure करके कुछ commands को elevated privileges के साथ अपने-आप चलाने के लिए सेट किया जा सकता है
उपलब्धता और कीमत
- Codex ऐप आज से macOS पर उपलब्ध है
- ChatGPT Plus, Pro, Business, Enterprise और Edu subscribers ChatGPT login के साथ CLI, web, IDE extension और app में Codex इस्तेमाल कर सकते हैं
- usage ChatGPT subscription में शामिल है, और ज़रूरत होने पर extra credits खरीदने का विकल्प भी है
- सीमित समय के लिए ChatGPT Free और Go users को भी Codex दिया जा रहा है
- इस अवधि में सभी paid plans के मौजूदा Codex users के लिए usage limit 2x बढ़ाई गई है
आगे की योजना
- दिसंबर 2024 के मध्य में GPT-5.2-Codex लॉन्च होने के बाद कुल Codex usage 2x बढ़ गया
- पिछले एक महीने में 10 लाख से अधिक developers ने Codex इस्तेमाल किया
- आगे की योजना
- Windows app लाने की तैयारी
- model capabilities की frontier को और आगे बढ़ाना
- तेज़ inference उपलब्ध कराना
- app के भीतर सुधार
- वास्तविक feedback के आधार पर multi-agent workflows को लगातार बेहतर बनाना
- parallel work management और agents के बीच switch करते समय context बनाए रखना और आसान बनाना
- Automations का विस्तार
- cloud-based triggers के support पर काम चल रहा है
- ताकि computer खुला न होने पर भी Codex background में लगातार चल सके
Codex की मुख्य धारणा
- यह उस सरल धारणा पर आधारित है कि हर चीज़ code से नियंत्रित होती है
- agent code के बारे में जितना बेहतर reason और generate कर सकेगा, वह हर तरह के technical और knowledge work में उतना ही अधिक सक्षम होगा
- मौजूदा मुख्य चुनौती: frontier models की capabilities और लोगों द्वारा उन्हें आसानी से वास्तविक काम में इस्तेमाल कर पाने के बीच का अंतर
- Codex को इस अंतर को कम करने के लिए डिज़ाइन किया गया है, ताकि model की पूरी intelligence को वास्तविक tasks में आसानी से निर्देशित, supervise और लागू किया जा सके
- फोकस best coding agent बनाने पर रहा है, जो code writing से आगे बढ़कर व्यापक knowledge work के लिए शक्तिशाली agents की नींव बनेगा
9 टिप्पणियां
आज इसे इस्तेमाल करके देखा, बहुत बढ़िया है, है ना?
लगता है VSCode forks को खत्म होने के लिए तैयार रहना होगा।
बेशक डेवलपर्स की नौकरियां भी कम हो सकती हैं।
लगता है कि Windows में sandbox तकनीक नहीं है, इसलिए वहाँ कुछ करना मुश्किल दिखता है।
Wsl या Windows दो...
मैं भी इन दिनों Codex को main तौर पर इस्तेमाल कर रहा हूँ, काफ़ी अच्छा है। Windows वर्ज़न भी जल्दी आ जाता तो अच्छा होता
शुरू करते ही यह पहले से Codex में काम कर रहे सारे projects एक साथ import कर लेता है, और बाईं तरफ project/thread यूनिट में उन्हें लाइन से दिखा देता है, इसलिए एक साथ कई काम करवाने के लिए यह बिल्कुल बढ़िया है.
क्या इसकी कोई वजह है कि Claude Code नहीं, बल्कि Codex मुख्य है?
मैं आमतौर पर लंबे plan documents बनाकर काम के लिए दे देता हूँ, लेकिन Codex इस मामले में ज़्यादा बेहतर फिट बैठता है.
और सच कहूँ तो rate limit भी ज़्यादा नहीं लगती. मैं सस्ते अकाउंट पर भी कई projects एक साथ चलाता हूँ.
ओह, टिप्पणी के लिए धन्यवाद।
OpenClaw के निर्माता का Codex इस्तेमाल करना भी ऐसा ही है
Codex की भी राय बहुत खराब नहीं लगती, लेकिन Hacker News की टिप्पणियाँ देखें तो फिर ऐसा भी नहीं लगता...
2222 Windows/Linux प्लीज़ T_T
मैं ChatGPT browser वाला Atlas भी इस्तेमाल करके देखना चाहता था, लेकिन Windows coming soon लिखकर काफ़ी समय से कोई ख़बर ही नहीं है
Hacker News की राय
ज़्यादातर तो बस साधारण chat UI के स्तर के हैं, लेकिन Electron में OS API (जैसे Win32) को सीधे call करना मुश्किल होता है, इसलिए deep integration संभव नहीं होता
Blender, Godot, Unity, UE5 जैसे complex software भी सब native चलते हैं, तो ऐसी कंपनियों का सिर्फ बहाने बनाना निराशाजनक है
Windows पर Electron लगभग de facto standard है, और Microsoft खुद भी इसे अक्सर इस्तेमाल करता है
macOS काफ़ी बेहतर है, लेकिन टीम आखिर में या तो सिर्फ Mac तक सीमित हो जाती है या cross-platform के लिए Electron चुनती है
UE5 का UI भी native जैसा लगभग नहीं लगता, और यह कहना मुश्किल है कि वह Electron से बेहतर है
Electron में भी native API call करना संभव है
ज़्यादातर users को फर्क नहीं पड़ता कि app native है या नहीं, और web developers को desktop app development में फिर से इस्तेमाल कर पाना कंपनी के लिए बड़ा फ़ायदा है
TUI या GUI बेकार की abstraction layers हैं, जो automation को कठिन बनाती हैं
असली बात है simple command invocation और log recording। [headless mode या session logs] उसी दिशा के क़रीब हैं
ज़्यादातर लोग परवाह नहीं करते कि app web technologies से बना है या नहीं
Electron की वजह से Linux porting भी आसान हो जाती है। अगर सिर्फ native पर अड़े रहते, तो शायद यह संभव ही नहीं होता
यह perfect नहीं है, लेकिन लगातार mid-level engineer जैसी quality का output देता है
लेकिन app “Loading projects…” पर अटक जाता है
docs link भी टूटा हुआ था, लेकिन यह लिंक अब काम कर रहा है
मैं कई VM environments को VS Code Remote से इस्तेमाल करता हूँ, इसलिए शायद port offset settings थोड़ा बदलना पड़ेगा
Codex कई बार problem-solving के दौरान loop में फँस जाता है, और Claude उसे अच्छी तरह पूरा कर देता है
दोनों models को बारी-बारी से इस्तेमाल करना काफ़ी असरदार है
फिर भी इसमें लगातार सुधार हो रहा है, इसलिए उम्मीद है
Cowork VM में Claude Code को call करता है, और Codex CLI को OS sandbox में चलाता है
इसका tech stack Electron 40, React 19, TypeScript, Node.js, SQLite, Vite आदि से बना है
macOS के लिए Sparkle, Squirrel, Sentry जैसी चीज़ें इस्तेमाल होती हैं
यह निर्देशों का पालन नहीं करता, बीच में रुक जाता है, या अजीब-सा code फेंक देता है
Nuxt 4+ से जुड़ा नया data नहीं होने की वजह से यह बार-बार errors देता रहा
Undo feature भी ठीक से काम नहीं करती, और कोई feedback भी नहीं मिलता
Claude Code ने वही काम एक बार में कर दिया, जबकि Codex ने बहुत समय लिया और नतीजा भी ख़राब था
यह देखकर Nokia N800 के दिनों की याद आई—संभावना तो है, लेकिन polish इतनी कम है कि OpenAI की direction को लेकर चिंता होती है
सोच रहा हूँ कि क्या Anthropic भी इसी तरह का Claude Code multi-agent app लाएगा
अगर साफ़ contracts (जैसे API definitions) हों, तो independent sessions में parallel काम करना ज़्यादा प्रभावी है
मैं खुद भी लगभग कुछ ऐसा ही बनाने वाला था
Recursive Language Models paper का मुख्य विचार यह है कि requirements, design, plan वगैरह को context में नहीं बल्कि immutable objects के रूप में manage किया जाए
मैं हर stage(spec, analysis, plan आदि) को .md files में manage करता हूँ, और approval stages वाले kanban process से चलाता हूँ
इससे बिना UI के भी काम अच्छी तरह चलता है, code quality बनी रहती है, और लंबे समय में development speed 10 गुना तेज़ हो जाती है
.claude/commandsऔर.claude/agentsका इस्तेमाल करके कई tasks एक साथ चला सकते हैंCodex उन चीज़ों को अच्छी तरह पकड़ लेता है जो Claude से छूट जाती हैं, और दोनों models को एक-दूसरे के पूरक की तरह इस्तेमाल करने से efficiency बढ़ती है
Codex का फ़ायदा इसकी सस्ती और लगभग unlimited usage है, जबकि Claude की quality बेहतर है
यह plan.md के आधार पर process बनाता है, और stages या hooks को dynamically जोड़ सकता है
workflow automation को document-based तरीके से control किया जा सकता है, इसलिए यह सुविधाजनक है
मैं पहले से ही top 3 major models के लिए पैसे दे रहा हूँ, इसलिए लगता है ऐसी services ज़्यादा दिन नहीं टिकेंगी
कहा गया कि इसमें 7 million tokens इस्तेमाल हुए, इसलिए हैरानी होती है कि ऐसा QA issue भी नहीं पकड़ा गया
ऐसे सूक्ष्म issues को test harness या QA agents से पकड़ना मुश्किल होता है
tokens बढ़ने पर polish तो बढ़ी, लेकिन gameplay वही रहा। समझ नहीं आता कि extra tokens ने आख़िर किया क्या
जानना चाहता हूँ कि क्या CLI version भी यही features support करेगा
अच्छा होता अगर सिर्फ internal network पर चलने वाला managed cluster feature होता
और team members के साथ work progress sharing भी संभव होती, तो आदर्श होता
अगर tool level पर ऐसा support मिले, तो यह कहीं ज़्यादा सुविधाजनक होगा
हाल में GPT-5.x की quality भी गिरी है, और इस announcement में सिर्फ Mac-only launch होना भी निराशाजनक है
article में typos भी बहुत हैं, और असल में इस्तेमाल किए गए prompts साझा न करना भी खलता है
फिर भी अगर सुधार हुआ, तो मैं इसे दोबारा आज़माना चाहूँगा
शायद इसलिए क्योंकि लोग Sonnet या Gemini 3.0 Flash की speed के आदी हो चुके हैं
$20 वाला ChatGPT, $200 वाले Claude से ज़्यादा efficient लगा