- OpenAI द्वारा सीधे जारी किया गया डेवलपर्स के लिए Codex लेक्चर वेबिनार वीडियो (58 मिनट)
- Codex को सिर्फ code completion या pair programming से आगे बढ़कर, इंजीनियरों को बड़े पैमाने के काम एजेंट को सौंपने में सक्षम बनाने वाले coding agent platform के रूप में डिज़ाइन किया गया है
- Codex app, CLI, IDE extension जैसे विभिन्न interfaces में एक ही backend साझा होता है, और कई काम एक साथ parallel में चलाए जा सकते हैं
- Plan, Design, Build, Test, Review, Document, Deploy & Maintenance तक पूरे software development lifecycle (SDLC) को कवर करता है
- agents.md फ़ाइल के ज़रिए repository स्तर पर एजेंट के व्यवहार निर्देश सेट किए जा सकते हैं, और Skills तथा Automations से दोहराए जाने वाले workflows को पैकेज करके अपने-आप चलाया जा सकता है
- 25 घंटे तक बिना रुके काम और 13~14 बार की server-side compaction के ज़रिए लंबे समय तक context बनाए रखा जा सकता है, और OS-स्तर sandboxing से सुरक्षा सुनिश्चित होती है
AI coding का विकास: code completion से agent delegation तक
- पिछले कुछ वर्षों में AI coding ने code completion (टाइपिंग गति में लगभग 10% सुधार) → pair programming (फ़ाइलों के बीच planning, test चलाना, repo संशोधन) के चरणों से होते हुए प्रगति की है
- दोनों तरीकों का फ़ोकस "बेहतर collaborator" बनाने पर था, लेकिन Codex का विकास एक साल पहले से delegation योग्य agent बनाने के लक्ष्य के साथ शुरू हुआ
- दिसंबर 2025 में GT 5.2 Codex model ने लंबे समय तक बिना रुके काम करने और उच्च steerability हासिल करके "वास्तविक agent delegation" की मुख्य बाधा दूर की
- इसके बाद अधिक तेज़ और कुशल GT 5.3, और फिर नवीनतम GT 5.4 model के साथ प्रदर्शन लगातार बेहतर हुआ
- बड़े enterprise codebase को स्थिर रूप से नेविगेट करना और उपयोगकर्ता की मंशा के अनुसार लंबे समय तक alignment बनाए रखना इसकी मुख्य प्रगति रही
Codex के उपलब्ध interfaces
- Codex एक ही agent को CLI, IDE extension, Codex app जैसे कई surfaces पर उपयोग करने देता है, और सभी एक ही backend साझा करते हैं
- Codex app parallel tasks चलाने के लिए सबसे visual interface है, और कई agents को एक साथ चलाकर उनके outputs की समीक्षा करने के लिए optimized है
- Peter Steinberger (OpenClaw के संस्थापक) का उदाहरण: पहले 10 से अधिक CLI windows संभालने के बजाय Codex app पर जाने से parallel agent management की दक्षता बढ़ी
- macOS और Windows दोनों समर्थित हैं, download openai.com/codex से किया जा सकता है, और Windows पर Microsoft Store में भी उपलब्ध है
- CLI में शुरुआती login के लिए
codex login command और फिर session शुरू करने के लिए codex command इस्तेमाल होती है
Codex app UI और settings
- model selection (GPT 5.4 आदि) और reasoning effort स्तर समायोजित किया जा सकता है: low, medium, high, extra high
- medium default है, और speed व reasoning depth के बीच सबसे अच्छा संतुलन देता है
- सरल सवालों के लिए low, और लंबे समय तक गहरी सोच की ज़रूरत हो तो high या extra high उपयुक्त है
- Speed mode (fast/standard) toggle से response speed नियंत्रित की जा सकती है
- local work के अलावा Git worktree mode और remote cloud container शुरू करने का विकल्प दिया जाता है
- permissions settings: default permissions (project के भीतर फ़ाइल पढ़ना/संपादित करना, risky commands पर approval माँगना) और full access (पूरे कंप्यूटर की फ़ाइलें, network access, बिना approval execution) में से चुन सकते हैं
- नए उपयोगकर्ताओं के लिए default permissions की सिफ़ारिश की जाती है
- बाईं sidebar से projects (folders) जोड़े और बदले जा सकते हैं
SDLC के हर चरण में Codex का उपयोग
- OpenAI ने "Building an AI Native Engineering Team" guide जारी की है, जिसमें बताया गया है कि coding agents SDLC के 7 चरणों (planning, design, build, test, review, documentation, deploy/maintenance) को कैसे तेज़ करते हैं
- खासकर test और review चरण code generation क्षमता बढ़ने के साथ और अधिक महत्वपूर्ण हो गए हैं
- जटिल codebase में reasoning और production-level code लिखने में Codex को विशेष रूप से उत्कृष्ट माना जा रहा है
Planning चरण
- Plan mode (
/plan या Shift+Tab) चालू करने पर Codex implementation से पहले योजना बनाता है
- डेमो में SwiftUI iOS companion app की planning माँगने पर Codex ने codebase explore करने के बाद follow-up questions दिए, जैसे authentication method और पहली release की scope
- सुझाए गए विकल्प स्वीकार करके या सीधे input देकर agent को steer किया जा सकता है
- plan में assumptions को स्पष्ट रूप से शामिल किया जाता है, ताकि उपयोगकर्ता उन्हें verify और modify कर सके
Design चरण — MCP integration
- MCP (Model Context Protocol) के ज़रिए Figma, Linear जैसे external tools का context सीधे Codex से जोड़ा जा सकता है
- CLI, IDE extension और Codex app सभी interfaces में समर्थित
- Figma MCP integration में design link paste करने पर Codex design context लाकर उसे code में बदल देता है
- अगर MCP configured न हो, तो Codex अपने-आप installation guidance दिखाता है
- ChatGPT app integration भी third-party द्वारा बनाई गई integration के रूप में सीधे Codex में उपयोग की जा सकती है
- इससे इंजीनियर core logic पर focus कर सकते हैं, और designers अधिक design concepts explore करने में समय दे सकते हैं
Build चरण
- SDLC में coding agents का सबसे बड़ा प्रभाव इसी चरण में है
- डेमो में N+1 query inefficiency fix करना, regression tests जोड़ना, API route authentication की कमी का audit करना, और NextAuth v4 से Auth.js v5 migration जैसे काम parallel में चलाए गए
- Figma design-आधारित code generation का परिणाम: 10 फ़ाइलों में बदलाव, 320 lines of code लिखीं, और CSS को हाथ से लिखने की ज़रूरत नहीं पड़ी
- Worktree feature local project की copy अपने-आप बनाकर parallel tasks के बीच conflicts रोकता है, इसलिए अलग repository copy की ज़रूरत नहीं होती
- agents.md में दिए गए
npx tsc, npm test जैसे validation·build·lint commands Codex अपने-आप चलाकर team conventions का पालन सुनिश्चित करता है
- build अब bottleneck नहीं रहा, enterprise environments में असली मुद्दा यह verify करना है कि code team conventions के अनुरूप है या नहीं
- terminal को Command+J से सीधे app के भीतर खोला जा सकता है
- iOS app के लिए भी Xcode सीधे खोले बिना Codex app के भीतर
xcode build चलाया जा सकता है
Slash Commands
- CLI, IDE extension और Codex app सभी में slash commands समर्थित हैं: plan mode, file mention, session state check, permissions change आदि
/experimental command से experimental features toggle किए जा सकते हैं
- इसमें multi-agent (sub-agents) creation feature भी शामिल है
- नई features के मामले में CLI अन्य interfaces से थोड़ा आगे है
- एक interface में toggle की गई settings, वही backend साझा होने के कारण सभी interfaces पर लागू हो जाती हैं
Review चरण
/review command से base branch के मुकाबले या local uncommitted changes पर code review चलाया जा सकता है
- Codex agents को P0/P1 स्तर के bugs पहचानने के लिए विशेष रूप से प्रशिक्षित किया गया है, इसलिए यह कम noise और अधिक signal वाला feedback देता है
- PR के CI/CD pipeline तक पहुँचने से पहले local स्तर पर issues जल्दी पकड़े जा सकते हैं
- GitHub Cloud native integration: Codex PR पर proactive या reactive code review अपने-आप कर सकता है
- regex rules review जैसे मामलों में इंसानों से छूट जाने वाले P1 issues पकड़ने का उदाहरण दिया गया
- GitLab, Bitbucket जैसे अन्य SCM के लिए Codex SDK के माध्यम से direct integration बनाई जा सकती है
- diff panel में सीधे code review comments जोड़ने पर वे अगली बातचीत के context में अपने-आप शामिल हो जाते हैं
Skills — reusable workflow packaging
- Skill एक open standard है, जिसमें Codex द्वारा चलाए जाने वाले reusable workflow instructions पैकेज किए जाते हैं
- संरचनात्मक रूप से यह एक folder होता है, और इसकी अनिवार्य फ़ाइल skill.md है (metadata + agent instructions)
- वैकल्पिक रूप से execution scripts, documents, templates जोड़े जा सकते हैं
- MCP को skill के भीतर embed करके external tool integrations भी जोड़ी जा सकती हैं
- डेमो उदाहरण: PR comments processing, BuildKite build failures auto-fix, dead code detection आदि
- Skill Creator (system skill): बातचीत के दौरान "create a skill to find dead code paths" जैसा कहने पर यह अपने-आप skill.md scaffold कर देता है
- Skill Installer (system skill): बनाई गई skill को local Codex skill directory में तुरंत install कर देता है
- लंबी बातचीत के बाद बार-बार दोहराए जाने वाले workflow को skill में बदल देने पर अगली बार एक ही invocation में पूरा workflow चलाया जा सकता है
- GitHub Issue Plan PR skill उदाहरण: एक prompt में GitHub issue triage → planning → editing → documentation → draft PR creation तक SDLC के पूरे चरणों को एक साथ पूरा करना
Documentation चरण
- Codex के सबसे कम आंके गए उपयोग क्षेत्रों में से एक
- system diagrams बनाना, feature implementation के समय documentation अपने-आप update करना आदि समर्थित हैं
- Linear MCP integration के साथ किसी विशेष ticket के fixes, regression test results और validation details को Linear board में अपने-आप document करने का डेमो दिखाया गया
Deploy & Maintenance चरण
- Codex app में Commit, Push, PR creation सीधे button click से किए जा सकते हैं (Git-आधारित)
- stack trace paste करने पर Codex पूरे codebase पर reasoning करके issue का कारण ढूँढ सकता है
- Triage Page skill: incident ID डालते ही details collect करना, incident verify करना, metrics·logs inspect करना, और patch तक one-stop तरीके से संभालना
- pager duty response को manual log analysis से agent delegation में बदलने का उदाहरण
- PR Babysitter skill: PR के CI/CD pipeline progress की लगातार निगरानी करता है, समस्या आने पर auto-fix करता है, और अंत में merge तक अपने-आप पूरा करता है
- OpenAI के बड़े monorepo environment में वास्तविक उपयोग में
- open-source skill repository से download किया जा सकता है
Automations — schedule-आधारित auto execution
- skills के उपयोग में सहज होने के बाद Automations feature से किसी तय schedule पर tasks अपने-आप चलाने के लिए सेट किए जा सकते हैं
- Sentry skill automation: हर गुरुवार (या रोज़) किसी विशेष repository के issues ढूँढकर fix suggestions देना या अपने-आप fix करना
- "What is everyone up to?" automation: हर दिन सुबह 9 बजे repository में team members की activity summary तैयार करना
- prompt सीधे डाले बिना भी Codex background में लगातार काम करता रह सकता है
Codex agents कैसे काम करते हैं
- Codex agents loop-based तरीके से काम करते हैं: उपयोगकर्ता स्पष्ट लक्ष्य और शुरुआती दिशा देता है → agent reasoning, tool calls, file reading, repository search, code writing, command execution को दोहराता है
- हर tool result अगले model call के लिए feedback बनता है, जिससे क्रमिक समझ और प्रगति बनती है
- context agent performance को तय करने वाला मुख्य कारक है: सही दिशा देने के लिए उचित मात्रा में input देना महत्वपूर्ण है
- OS-level sandboxing: यह सिर्फ harness-level हल्की पाबंदी नहीं, बल्कि operating system स्तर पर network और file access को नियंत्रित करता है
- models के विकसित होने के साथ हल्के सुरक्षा उपायों को bypass करने की संभावना को ध्यान में रखकर यह डिज़ाइन किया गया है
- सभी systems (Mac, Windows) में sandbox समर्थन है, और Windows में WSL की तुलना में अधिक सुरक्षित native Windows sandbox लागू किया गया है
- config TOML file में approval mode (approval timing) और sandbox mode (access scope) की विस्तृत settings की जा सकती हैं
- default value "on request" है, जिसमें सामान्य रूप से run होता है और privilege escalation की ज़रूरत होने पर pause करता है
Compaction — लंबे threads का प्रबंधन
- जब बातचीत model की context limit के पास पहुँचती है, तो Codex शुरुआती हिस्से को compress करने के लिए compaction करता है
- compaction server-side पर raw chain of thought के आधार पर होती है, इसलिए client-side की तुलना में काम की वास्तविक सामग्री को बेहतर ढंग से सुरक्षित रखती है
- वास्तविक उदाहरण: 25 घंटे तक बिना रुके काम करते हुए 13~14 बार compaction करके भी context बनाए रखा गया
प्रभावी delegation के लिए prompting best practices
- न्यूनतम prompt में स्पष्ट goal, constraints, और "done" की definition शामिल करें
- verification conditions को prompt में ही embed करें: success criteria, चलाए जाने वाले tests·build commands स्पष्ट लिखें
- open-ended prompts का उपयोग करें: performance improvement ideas, test coverage gaps आदि के बारे में Codex से पूछकर उसे thought partner की तरह उपयोग करें
agents.md — agent behavior instruction file
- Cursor के Rules, Windsurf settings आदि की तरह एक open format, यह OpenAI का proprietary format नहीं है
- यह हर Codex session में अपने-आप load होती है और consistent results देने में मदद करती है
- 3-स्तरीय priority system:
- global (
~/.codex/agents.md): व्यक्तिगत default settings (team से असंबंधित)
- repository root (
agents.md): पूरे repo की conventions
- subdirectory (
agents.md): microservice/उप-फ़ोल्डर-विशिष्ट detailed instructions
- Codex project root से current directory तक path के साथ agents.md को concatenate करता है, और अधिक specific files को प्राथमिकता मिलती है
- इनमें शामिल करने की सिफ़ारिश: repository overview, run commands, test expectations, key module locations, commit/PR guidelines
/init command (CLI) से पहला agents.md अपने-आप बनाया जा सकता है, जिससे cold start समस्या कम होती है
- इसे 100 lines से कम और संक्षिप्त रखने की सिफ़ारिश की जाती है (OpenAI के internal monorepo agents.md के आधार पर)
- अगर सामग्री लंबी हो जाए तो task-specific Markdown files (planning.md, code-review.md, architecture.md आदि) में बाँटकर agents.md से refer करें
- Codex से local session logs (save path उपलब्ध) का विश्लेषण करवाकर हर हफ़्ते agents.md सुधार सुझाव अपने-आप प्राप्त करने का automation pattern भी बताया गया
- Codex से conversation retrospective माँगकर gotcha section या notes को agents.md में अपने-आप शामिल करवाने का तरीका भी साझा किया गया
समापन — Codex अपनाने के लिए 3 मुख्य व्यावहारिक कदम
- agents.md बनाना और custom settings कॉन्फ़िगर करना
- Codex को वास्तविक काम देना, और रोज़मर्रा में उपयोग होने वाले tools (MCP) से जोड़ना
- सिर्फ build चरण में नहीं, बल्कि design से लेकर deploy·maintenance तक पूरे development loop में Codex चलाते हुए लगातार दोहराना
अभी कोई टिप्पणी नहीं है.