OpenAI ने macOS के लिए Codex ऐप पेश किया

(openai.com)

12 पॉइंट द्वारा GN⁺ 2026-02-03 | 9 टिप्पणियां | WhatsApp पर शेयर करें

कई AI agents को एक साथ मैनेज करने वाला AI development integrated environment, जो parallel work और long-term collaboration को सपोर्ट करता है
हर agent एक स्वतंत्र thread में चलता है, जिससे project-wise multitasking, code review, diff comments और manual edits संभव होते हैं
Skills फीचर के ज़रिए यह सिर्फ code writing तक सीमित नहीं रहता, बल्कि information gathering, problem solving, image generation, document creation और cloud deployment जैसे कामों तक फैलता है
Automations फीचर से तय schedule के अनुसार background में repetitive tasks अपने-आप चलाए जा सकते हैं
डिफ़ॉल्ट रूप से sandbox security लागू होती है, और network access जैसी ऊँचे अधिकार वाली commands के लिए user approval चाहिए
ChatGPT Free और Go users के लिए भी सीमित समय तक Codex उपलब्ध, और paid plans में usage limit 2x बढ़ाई गई

Codex ऐप का परिचय: agents के लिए command center

अप्रैल 2025 में Codex लॉन्च होने के बाद developers के agents इस्तेमाल करने का तरीका बुनियादी रूप से बदल गया
- अब model जटिल और लंबे समय तक चलने वाले tasks को शुरू से अंत तक संभाल सकता है
- developers अब कई agents को पूरे project में coordinate करके काम delegate कर सकते हैं और parallel execution करा सकते हैं
मुख्य चुनौती अब "agent क्या कर सकता है" से बदलकर "इंसान बड़े पैमाने पर agents को कैसे निर्देशित, supervise और collaborate कर सकता है" पर आ गई है
मौजूदा IDE और terminal-आधारित tools इस तरह के workflow को सपोर्ट करने के लिए डिज़ाइन नहीं किए गए थे, इसलिए नए tool की ज़रूरत थी
macOS के लिए Codex ऐप कई AI agents को एक साथ मैनेज कर सकता है और parallel में tasks चला सकता है
यह long-running tasks को सपोर्ट करता है और agents के बीच collaboration के माध्यम से software design, development, deployment और maintenance की पूरी प्रक्रिया मैनेज कर सकता है

multi-agent parallel work

Codex ऐप agents के साथ multitasking के लिए एक focused space देता है
- agents project के हिसाब से अलग separate threads में चलते हैं, जिससे context खोए बिना tasks के बीच switch किया जा सकता है
- thread के अंदर agent के changes review किए जा सकते हैं, diff पर comments जोड़े जा सकते हैं, या editor में सीधे edits किए जा सकते हैं
Worktrees का built-in support कई agents को एक ही repository में बिना conflict के काम करने देता है
- हर agent code की isolated copy पर काम करता है, इसलिए local git state को प्रभावित किए बिना अलग-अलग रास्ते explore किए जा सकते हैं
- agent के काम के दौरान changes को local में checkout किया जा सकता है, या local git state बदले बिना काम जारी रखा जा सकता है
Codex CLI और IDE extension से session history और settings अपने-आप import हो जाते हैं, इसलिए मौजूदा project में तुरंत इस्तेमाल संभव है

Skills: code generation से आगे का विस्तार

Codex अब code लिखने वाले agent से आगे बढ़कर code का इस्तेमाल करके computer पर काम करने वाले agent में विकसित हो रहा है
Skills के ज़रिए इसे information gathering, synthesis, problem solving और writing जैसे code generation से आगे के कामों तक बढ़ाया जा सकता है
- instructions, resources और scripts को bundle करके Codex tools से connect कर सकता है और workflows चला सकता है
- टीम की preferences के अनुसार काम को भरोसेमंद तरीके से पूरा किया जा सकता है
Codex ऐप में Skills बनाने और मैनेज करने के लिए dedicated interface शामिल है
- किसी खास Skill के इस्तेमाल को explicitly request किया जा सकता है, या task के हिसाब से उसे अपने-आप इस्तेमाल करने के लिए सेट किया जा सकता है
Skills उपयोग का उदाहरण: racing game बनाना
- Codex से अलग-अलग racers, 8 maps और spacebar से इस्तेमाल होने वाले items वाला racing game बनाने को कहा गया
  - image generation skill (GPT Image आधारित) और web game development skill का इस्तेमाल किया गया
  - एक ही शुरुआती prompt से इसने 7 million से अधिक tokens पर स्वतंत्र रूप से काम करके game पूरा किया
  - इसने designer, game developer और QA tester की भूमिका निभाते हुए वास्तव में game खेलकर उसे verify भी किया
- game का नाम: Voxel Velocity, Three.js का इस्तेमाल करने वाला 3D voxel kart racer
  - single race mode (हमेशा 3 laps, 1 human vs 7 CPU, 8 tracks तुरंत उपलब्ध)
  - arcade driving model, drift charge system, boost tiers (Tier 1 0.7 सेकंड, Tier 2 1.1 सेकंड, Tier 3 1.5 सेकंड)
  - 8 characters, 8 items, CPU difficulty presets, AI spline implementation
उपलब्ध प्रमुख Skills
- Implement designs: Figma से design context, assets और screenshots लाकर 1:1 visual fidelity वाली production UI code में बदलना
- Manage projects: Linear में bug triage, release tracking और team workload management
- Deploy to the cloud: Cloudflare, Netlify, Render, Vercel जैसे प्रमुख cloud hosts पर web apps deploy करना
- Generate images: GPT Image आधारित image generation skill से websites, UI mockups, product visuals और game assets के लिए images बनाना और edit करना
- Build with OpenAI APIs: OpenAI API के साथ build करते समय latest documentation का संदर्भ लेना
- Create documents: PDF, spreadsheet और docx files को पढ़ना, बनाना और edit करना (professional formatting और layout support सहित)
- ऐप में नई skill बनाने पर वह app, CLI और IDE extension हर जगह इस्तेमाल की जा सकती है
- skills को repository में check-in करके पूरी टीम के साथ share किया जा सकता है

Automations: repetitive tasks का automation

Automations फीचर के ज़रिए Codex तय schedule के अनुसार background में अपने-आप tasks चलाता है
- इसे instructions और optional skills को मिलाकर configure किया जाता है
- पूरा होने पर results review queue में सेव होते हैं, ताकि ज़रूरत पड़ने पर आगे काम जारी रखा जा सके
OpenAI के अंदरूनी उपयोग के उदाहरण
- daily issue triage
- CI failures ढूँढना और summarize करना
- daily release brief बनाना
- bug verification

Personality: काम करने की शैली को customize करना

हर developer की agents के साथ काम करने की पसंद अलग होती है
- कुछ लोग concise और action-oriented partner चाहते हैं
- कुछ लोग ज़्यादा conversational और empathetic interaction पसंद करते हैं
Codex में दो तरह की personality चुनी जा सकती हैं: concise और practical style बनाम conversational और empathetic style
- functionality बदले बिना इसे पसंदीदा working style के अनुसार ढाला जा सकता है
- app, CLI और IDE extension में /personality command से इसे सेट किया जा सकता है

सुरक्षा: डिफ़ॉल्ट रूप से लागू और configurable

Codex agent stack के पूरे ढाँचे में design stage से ही security integrated है
Codex CLI की तरह यह native, open source, configurable system-level sandboxing का इस्तेमाल करता है
default settings
- agents को सिर्फ काम कर रहे folder या branch की files edit करने और cached web search करने की अनुमति होती है
- network access जैसी ऊँचे अधिकार वाली commands चलाने पर user approval माँगा जाता है
project या team rules configure करके कुछ commands को elevated privileges के साथ अपने-आप चलाने के लिए सेट किया जा सकता है

उपलब्धता और कीमत

Codex ऐप आज से macOS पर उपलब्ध है
ChatGPT Plus, Pro, Business, Enterprise और Edu subscribers ChatGPT login के साथ CLI, web, IDE extension और app में Codex इस्तेमाल कर सकते हैं
usage ChatGPT subscription में शामिल है, और ज़रूरत होने पर extra credits खरीदने का विकल्प भी है
सीमित समय के लिए ChatGPT Free और Go users को भी Codex दिया जा रहा है
इस अवधि में सभी paid plans के मौजूदा Codex users के लिए usage limit 2x बढ़ाई गई है

आगे की योजना

दिसंबर 2024 के मध्य में GPT-5.2-Codex लॉन्च होने के बाद कुल Codex usage 2x बढ़ गया
पिछले एक महीने में 10 लाख से अधिक developers ने Codex इस्तेमाल किया
आगे की योजना
- Windows app लाने की तैयारी
- model capabilities की frontier को और आगे बढ़ाना
- तेज़ inference उपलब्ध कराना
app के भीतर सुधार
- वास्तविक feedback के आधार पर multi-agent workflows को लगातार बेहतर बनाना
- parallel work management और agents के बीच switch करते समय context बनाए रखना और आसान बनाना
Automations का विस्तार
- cloud-based triggers के support पर काम चल रहा है
- ताकि computer खुला न होने पर भी Codex background में लगातार चल सके

Codex की मुख्य धारणा

यह उस सरल धारणा पर आधारित है कि हर चीज़ code से नियंत्रित होती है
agent code के बारे में जितना बेहतर reason और generate कर सकेगा, वह हर तरह के technical और knowledge work में उतना ही अधिक सक्षम होगा
मौजूदा मुख्य चुनौती: frontier models की capabilities और लोगों द्वारा उन्हें आसानी से वास्तविक काम में इस्तेमाल कर पाने के बीच का अंतर
Codex को इस अंतर को कम करने के लिए डिज़ाइन किया गया है, ताकि model की पूरी intelligence को वास्तविक tasks में आसानी से निर्देशित, supervise और लागू किया जा सके
फोकस best coding agent बनाने पर रहा है, जो code writing से आगे बढ़कर व्यापक knowledge work के लिए शक्तिशाली agents की नींव बनेगा

9 टिप्पणियां

treestae 2026-02-03

आज इसे इस्तेमाल करके देखा, बहुत बढ़िया है, है ना?
लगता है VSCode forks को खत्म होने के लिए तैयार रहना होगा।
बेशक डेवलपर्स की नौकरियां भी कम हो सकती हैं।

m00nlygreat 2026-02-03

लगता है कि Windows में sandbox तकनीक नहीं है, इसलिए वहाँ कुछ करना मुश्किल दिखता है।

cshj55 2026-02-03

Wsl या Windows दो...

GN⁺ 2026-02-03

Hacker News की राय

समझ नहीं आता कि AI कंपनियां, जिनके पास अरबों डॉलर हैं, अभी भी native apps क्यों नहीं बना पातीं
ज़्यादातर तो बस साधारण chat UI के स्तर के हैं, लेकिन Electron में OS API (जैसे Win32) को सीधे call करना मुश्किल होता है, इसलिए deep integration संभव नहीं होता
Blender, Godot, Unity, UE5 जैसे complex software भी सब native चलते हैं, तो ऐसी कंपनियों का सिर्फ बहाने बनाना निराशाजनक है
- desktop development ecosystem बुरी तरह बिखरा हुआ है। Microsoft ने इतने सारे आधे-अधूरे frameworks निकाले हैं कि समझ नहीं आता क्या इस्तेमाल करें
  Windows पर Electron लगभग de facto standard है, और Microsoft खुद भी इसे अक्सर इस्तेमाल करता है
  macOS काफ़ी बेहतर है, लेकिन टीम आखिर में या तो सिर्फ Mac तक सीमित हो जाती है या cross-platform के लिए Electron चुनती है
- आजकल video game UI भी काफ़ी बार HTML/JS आधारित होता है
  UE5 का UI भी native जैसा लगभग नहीं लगता, और यह कहना मुश्किल है कि वह Electron से बेहतर है
  Electron में भी native API call करना संभव है
  ज़्यादातर users को फर्क नहीं पड़ता कि app native है या नहीं, और web developers को desktop app development में फिर से इस्तेमाल कर पाना कंपनी के लिए बड़ा फ़ायदा है
- मैं तो इसे उल्टा देखता हूँ। अगर सब कुछ text interface में बनाया जाए तो model tools को स्वाभाविक रूप से सीख सकता है
  TUI या GUI बेकार की abstraction layers हैं, जो automation को कठिन बनाती हैं
  असली बात है simple command invocation और log recording। [headless mode या session logs] उसी दिशा के क़रीब हैं
- AI से बना नतीजा आख़िरकार एक input box वाला Electron app ही निकलता है, यही हक़ीक़त है
- समझ नहीं आता कि native app से मिलने वाली कौन-सी functionality इतनी ज़रूरी है
  ज़्यादातर लोग परवाह नहीं करते कि app web technologies से बना है या नहीं
  Electron की वजह से Linux porting भी आसान हो जाती है। अगर सिर्फ native पर अड़े रहते, तो शायद यह संभव ही नहीं होता
पिछले दो महीनों में मैंने Codex काफ़ी इस्तेमाल किया है, और यह काफ़ी प्रभावशाली लगा
यह perfect नहीं है, लेकिन लगातार mid-level engineer जैसी quality का output देता है
लेकिन app “Loading projects…” पर अटक जाता है
docs link भी टूटा हुआ था, लेकिन यह लिंक अब काम कर रहा है
मैं कई VM environments को VS Code Remote से इस्तेमाल करता हूँ, इसलिए शायद port offset settings थोड़ा बदलना पड़ेगा
- मैं ChatGPT($20/माह) और Claude($200/साल) साथ में इस्तेमाल करता हूँ, और Codex पर अभी तक कभी usage limit नहीं लगी
  Codex कई बार problem-solving के दौरान loop में फँस जाता है, और Claude उसे अच्छी तरह पूरा कर देता है
  दोनों models को बारी-बारी से इस्तेमाल करना काफ़ी असरदार है
- मुझे जवाब मिला कि broken link बताने के लिए धन्यवाद। उन्होंने कहा loading speed भी बेहतर की जा रही है
- Codex backend या logical tasks में मज़बूत है, लेकिन simple frontend UI tasks में अक्सर ग़लती करता है
  फिर भी इसमें लगातार सुधार हो रहा है, इसलिए उम्मीद है
- मैं Cursor ही इस्तेमाल करता रहूँगा। OpenAI को नया app निकालने से ज़्यादा existing app के bug fixes पर ध्यान देना चाहिए
Codex, Claude Cowork जैसे competing products की तरह लगता है
Cowork VM में Claude Code को call करता है, और Codex CLI को OS sandbox में चलाता है
इसका tech stack Electron 40, React 19, TypeScript, Node.js, SQLite, Vite आदि से बना है
macOS के लिए Sparkle, Squirrel, Sentry जैसी चीज़ें इस्तेमाल होती हैं
- नाम और diff/worktree-केंद्रित design को देखकर लगता है कि इसका developer focus काफ़ी मज़बूत है
- यह stack bootcamp-level का लगता है, इसलिए थोड़ा निराशाजनक है
- जानना चाहूँगा कि Sentry integration native है या MCP के ज़रिए
- इसमें git और terminal view है, जो CLI users के लिए बड़ा फ़ायदा है। skills feature से भी उम्मीद है
मैंने Codex इस्तेमाल किया, और यह इतना धीमा और बेवकूफ़ था कि ग़ुस्सा आ गया
यह निर्देशों का पालन नहीं करता, बीच में रुक जाता है, या अजीब-सा code फेंक देता है
Nuxt 4+ से जुड़ा नया data नहीं होने की वजह से यह बार-बार errors देता रहा
Undo feature भी ठीक से काम नहीं करती, और कोई feedback भी नहीं मिलता
Claude Code ने वही काम एक बार में कर दिया, जबकि Codex ने बहुत समय लिया और नतीजा भी ख़राब था
यह देखकर Nokia N800 के दिनों की याद आई—संभावना तो है, लेकिन polish इतनी कम है कि OpenAI की direction को लेकर चिंता होती है
OpenAI का Codex असल में Emdash, Conductor जैसे products का official version लगता है
सोच रहा हूँ कि क्या Anthropic भी इसी तरह का Claude Code multi-agent app लाएगा
- Claude Code Desktop पहले से मौजूद है
- लगता है multi-agent approach को कुछ ज़्यादा ही बढ़ा-चढ़ाकर पेश किया गया है
  अगर साफ़ contracts (जैसे API definitions) हों, तो independent sessions में parallel काम करना ज़्यादा प्रभावी है
- GUI में Claude Code इस्तेमाल करते समय, क्या पूरा Claude Code harness इस्तेमाल होता है या सिर्फ model, यह जानना दिलचस्प होगा
- Emdash का नाम पहली बार सुना, लेकिन ऐसे tools इतने ज़्यादा हैं कि promotion मुश्किल है और बाज़ार बहुत शोरगुल वाला हो गया है
  मैं खुद भी लगभग कुछ ऐसा ही बनाने वाला था
- Claude Code का web version research preview के रूप में उपलब्ध है
agent features मुझे ज़्यादा दिलचस्प नहीं लगते
Recursive Language Models paper का मुख्य विचार यह है कि requirements, design, plan वगैरह को context में नहीं बल्कि immutable objects के रूप में manage किया जाए
मैं हर stage(spec, analysis, plan आदि) को .md files में manage करता हूँ, और approval stages वाले kanban process से चलाता हूँ
इससे बिना UI के भी काम अच्छी तरह चलता है, code quality बनी रहती है, और लंबे समय में development speed 10 गुना तेज़ हो जाती है
लगता है Codex की core feature parallel agent execution है, लेकिन मैं Claude Code में पिछले 9 महीनों से यही कर रहा हूँ
.claude/commands और .claude/agents का इस्तेमाल करके कई tasks एक साथ चला सकते हैं
Codex उन चीज़ों को अच्छी तरह पकड़ लेता है जो Claude से छूट जाती हैं, और दोनों models को एक-दूसरे के पूरक की तरह इस्तेमाल करने से efficiency बढ़ती है
Codex का फ़ायदा इसकी सस्ती और लगभग unlimited usage है, जबकि Claude की quality बेहतर है
मैं ज़्यादातर Claude Code इस्तेमाल करता हूँ, लेकिन सबसे अच्छा orchestrator मुझे Zencoder.ai का Zenflow लगा
यह plan.md के आधार पर process बनाता है, और stages या hooks को dynamically जोड़ सकता है
workflow automation को document-based तरीके से control किया जा सकता है, इसलिए यह सुविधाजनक है
- लेकिन search करो तो अक्सर यह भी एक और “AI credit package बेचने वाला app” ही निकलता है
  मैं पहले से ही top 3 major models के लिए पैसे दे रहा हूँ, इसलिए लगता है ऐसी services ज़्यादा दिन नहीं टिकेंगी
- पहले से ही 500 से ज़्यादा AI integration services मौजूद हैं
demo game “Voxel Velocity” के नीचे “Enter start” लिखा है, लेकिन असल में Enter सिर्फ selection बदलता है
कहा गया कि इसमें 7 million tokens इस्तेमाल हुए, इसलिए हैरानी होती है कि ऐसा QA issue भी नहीं पकड़ा गया
- game खुद प्रभावशाली है, लेकिन बारीक हिस्सों में quality control की कमी है
  ऐसे सूक्ष्म issues को test harness या QA agents से पकड़ना मुश्किल होता है
- 60k, 800k, और 7 million token versions के बीच game functionality में लगभग कोई फ़र्क नहीं है
  tokens बढ़ने पर polish तो बढ़ी, लेकिन gameplay वही रहा। समझ नहीं आता कि extra tokens ने आख़िर किया क्या
मैं Linux user हूँ, इसलिए Codex के Mac-only होने का अफ़सोस है
जानना चाहता हूँ कि क्या CLI version भी यही features support करेगा
- OpenAI के Romain ने खुद जवाब दिया। उन्होंने कहा कि Electron-based होने की वजह से Windows और Linux support भी जल्द जोड़ा जाएगा
- अभी Mac पर भी यह Intel chips पर नहीं चलता
- experimental use के लिए macOS उपयुक्त है। hardware configurations तय होने की वजह से edge-case bugs कम होते हैं
अफ़सोस है कि सब कुछ सिर्फ local पर चलता है
अच्छा होता अगर सिर्फ internal network पर चलने वाला managed cluster feature होता
और team members के साथ work progress sharing भी संभव होती, तो आदर्श होता
- मैं ssh और tmux से लगभग ऐसा ही इस्तेमाल कर रहा हूँ
  अगर tool level पर ऐसा support मिले, तो यह कहीं ज़्यादा सुविधाजनक होगा
OpenAI और Codex ने शुरुआती innovation को आगे बढ़ाया था, लेकिन अब Claude और Gemini ज़्यादा आगे दिखते हैं
हाल में GPT-5.x की quality भी गिरी है, और इस announcement में सिर्फ Mac-only launch होना भी निराशाजनक है
article में typos भी बहुत हैं, और असल में इस्तेमाल किए गए prompts साझा न करना भी खलता है
फिर भी अगर सुधार हुआ, तो मैं इसे दोबारा आज़माना चाहूँगा
- video में code generation वाला हिस्सा 5x से भी ज़्यादा speed-up editing के साथ दिखा, यह साफ़ नज़र आया
  शायद इसलिए क्योंकि लोग Sonnet या Gemini 3.0 Flash की speed के आदी हो चुके हैं
- मुझे तो उल्टा Codex, Claude Code या Gemini की तुलना में complex tasks handle करने में ज़्यादा stable लगा
  $20 वाला ChatGPT, $200 वाले Claude से ज़्यादा efficient लगा
- macOS-first launch policy OpenAI पहले भी अपनाता रहा है

xguru 2026-02-03

मैं भी इन दिनों Codex को main तौर पर इस्तेमाल कर रहा हूँ, काफ़ी अच्छा है। Windows वर्ज़न भी जल्दी आ जाता तो अच्छा होता

शुरू करते ही यह पहले से Codex में काम कर रहे सारे projects एक साथ import कर लेता है, और बाईं तरफ project/thread यूनिट में उन्हें लाइन से दिखा देता है, इसलिए एक साथ कई काम करवाने के लिए यह बिल्कुल बढ़िया है.

tested 2026-02-03

क्या इसकी कोई वजह है कि Claude Code नहीं, बल्कि Codex मुख्य है?

xguru 2026-02-03

मैं आमतौर पर लंबे plan documents बनाकर काम के लिए दे देता हूँ, लेकिन Codex इस मामले में ज़्यादा बेहतर फिट बैठता है.
और सच कहूँ तो rate limit भी ज़्यादा नहीं लगती. मैं सस्ते अकाउंट पर भी कई projects एक साथ चलाता हूँ.

tested 2026-02-03

ओह, टिप्पणी के लिए धन्यवाद।

OpenClaw के निर्माता का Codex इस्तेमाल करना भी ऐसा ही है

https://hi.news.hada.io/topic?id=26222

Codex की भी राय बहुत खराब नहीं लगती, लेकिन Hacker News की टिप्पणियाँ देखें तो फिर ऐसा भी नहीं लगता...

unknowncyder 2026-02-03

2222 Windows/Linux प्लीज़ T_T
मैं ChatGPT browser वाला Atlas भी इस्तेमाल करके देखना चाहता था, लेकिन Windows coming soon लिखकर काफ़ी समय से कोई ख़बर ही नहीं है