Claude के साथ कई महीनों तक जूझने के बाद Codex एक vibe coder के सपने जैसा लगता है

(reddit.com)

23 पॉइंट द्वारा GN⁺ 2026-05-17 | 9 टिप्पणियां | WhatsApp पर शेयर करें

3 महीनों तक Claude/Anthropic के साथ कोडिंग की, लेकिन repo-स्केल के काम में इसकी विश्वसनीयता कम होती गई, जिससे अलग मॉनिटरिंग वर्कफ़्लो की ज़रूरत पड़ी
4.7 दौर में वास्तविक इम्प्लीमेंटेशन लगभग 40% ही होता था, फिर भी यह पूरा होने का भ्रम पैदा करता था या stub/placeholder के आसपास ज़रूरत से ज़्यादा आत्मविश्वास दिखाता था
Max x20 की लागत के बावजूद, उत्पादकता से अधिक token consumption और निगरानी का बोझ बढ़ गया, इसलिए 12 मई को GPT-5.5 + Codex पर स्विच किया गया
Codex बिना अत्यधिक प्रॉम्प्टिंग के adjacent code को बेहतर समझता है और regression पकड़ लेता है, जिससे lint/test loop और बड़े पैमाने की refactoring संभालना संभव हो गया
माइग्रेशन लगभग सिर्फ CLAUDE.md→AGENTS.md स्थानांतरण और hooks बनाए रखने तक सीमित रहा, और इस वर्कफ़्लो में वापस जाने का फिलहाल कोई इरादा नहीं है

Claude से Codex पर स्विच करने के बाद बदला हुआ डेवलपमेंट फ़्लो

पिछले 3 महीनों में मुख्य रूप से Claude/Anthropic के साथ कोडिंग की गई, और Opus 4.6 के रिलीज़ के समय इसकी आर्किटेक्चर समझ, बड़े context को संभालने की क्षमता, और तेज़ feature implementation इसकी प्रमुख ताकतें लगीं
समय बीतने के साथ repo-स्केल के काम में इसकी विश्वसनीयता कम होती गई, और मॉडल की निगरानी के लिए अलग वर्कफ़्लो की ज़रूरत पड़ने लगी
- adjacent files में regression जाँचने वाले कई agents
- हर बड़े commit पर लगने वाला “senior reviewer” agent
- implementation drift और अधूरे implementation की जाँच के लिए लगातार validation
- उन कामों को पकड़ने वाली lint/test pipeline जिन्हें मॉडल आत्मविश्वास से पूरा बता देता था
4.7 दौर तक आते-आते व्यक्तिगत वर्कफ़्लो में समस्या और बढ़ गई
- वास्तविक implementation लगभग 40% के स्तर पर होती थी, लेकिन feature को पूरा बताया जाता था
- stub/placeholder के आसपास बिना आधार वाला आत्मविश्वास दिखता था
- व्यावहारिक रूप से संभव बदलावों के लिए भी “अलग session की ज़रूरत है” कहना या अत्यधिक समय-आकलन देना जैसी बचाव वाली प्रवृत्ति दिखती थी
Max x20 की लागत चुकाने के बावजूद, उत्पादकता बढ़ने से ज़्यादा token consumption और निगरानी का बोझ बढ़ना अधिक महसूस हुआ
अंततः 12 मई को GPT-5.5 + Codex पर स्विच किया गया, और कुछ ही महीनों में AI coding तनाव से ज़्यादा आरामदायक अनुभव जैसी लगने लगी

GPT-5.5 + Codex में महसूस हुए फायदे

Codex अत्यधिक प्रॉम्प्टिंग के बिना भी adjacent code को अच्छी तरह समझता है और regression बेहतर पकड़ता है
lint/test feedback loop अधिक कसा हुआ काम करता है, और large-scale refactoring भी वास्तव में संभालना संभव हो गया
infra decisions और architecture changes बिखरे हुए महसूस होने के बजाय एकसमान दिशा में आगे बढ़ते हैं, और सिर्फ पूरा होने का दिखावा करने के बजाय सच में काम पूरा करने के अधिक करीब लगते हैं
/fast से साप्ताहिक usage जल्दी खत्म होने की आशंका रहती है, इसलिए इसे अक्सर टाला जाता है, लेकिन सिर्फ high/xhigh से भी उत्पादकता में बड़ा सुधार मिला
पूरे repository zip को GPT-5.5 Pro extended thinking में डालने पर उन समस्याओं को हल करने में मदद मिलती है जिन पर दूसरे models बार-बार विफल होते रहे
माइग्रेशन में भी कोई बड़ा friction नहीं था
- CLAUDE.md को AGENTS.md में स्थानांतरित किया गया
- hooks वैसे ही बने रहे
- पूरे वर्कफ़्लो को लगभग बदलने की ज़रूरत नहीं पड़ी
इसका मतलब यह नहीं कि सभी को तुरंत स्विच कर लेना चाहिए, लेकिन इस वर्कफ़्लो में फिलहाल वापस जाने का कोई इरादा नहीं है

9 टिप्पणियां

summerz 2026-05-18

किसी मोड़ पर आकर लगता है कि codex कई मायनों में कहीं बेहतर है।

skageektp 2026-05-18

क्या सिर्फ मैं ही बार-बार subscriptions बदलता रहता हूँ? हाहा टॉप वाला बार-बार बदल रहा है हाहाहा

skageektp 2026-05-18

लेकिन यह Codex subreddit की पोस्ट है, इसलिए इसे थोड़ा ध्यान में रखकर देखने की ज़रूरत है। Reddit में subreddit के हिसाब से किसी चीज़ को कितना बढ़ावा मिलता है, उसमें काफ़ी बड़ा फ़र्क होता है।

holywork 2026-05-18

पहले जब मैं cursor इस्तेमाल करता था, तो कई models को बारी-बारी से इस्तेमाल करता था, लेकिन gpt 5 के बाद से openai models तुलनात्मक रूप से काफ़ी ज़्यादा सावधान और साथ ही मेहनती लगते हैं।

gkhcdef 2026-05-17

मुझे भी लगा था कि codex में tokens ज़्यादा मिलते हैं और यह claude द्वारा बनाए गए plans या code की खामियां अच्छी तरह पकड़ लेता है, इसलिए पूरी तरह switch करने के इरादे से मैंने extra payment भी किया था.
मेरा यह भरोसा अभी भी बना हुआ है, लेकिन मैं claude को पूरी तरह छोड़ भी नहीं पाया हूं. अब जब मैं codex को main के तौर पर इस्तेमाल करता हूं, तो claude codex के plans या code में खामियां ढूंढ निकालता है.

xguru 2026-05-17

मैं लगातार Codex को ही main के तौर पर इस्तेमाल करता रहा हूँ, और इन दिनों लगता है कि यह धीरे-धीरे और ज़्यादा स्मार्ट होता जा रहा है.

अभी-अभी का अनुभव है, अब यह अपने-आप automation भी काफ़ी अच्छी तरह कर लेता है. CDN से जुड़ी कोई setting adjustment की, तो इसने खुद ही कहा कि 3 दिन बाद check करेगा और 4320 मिनट बाद चलने वाला timer अपने-आप set कर दिया.

Mac के लिए Codex app बहुत सुविधाजनक है. अब mobile पर भी काफ़ी अच्छा हो गया है, इसलिए लगता है कि अब और ज़्यादा काम करूँगा

helloppfm 2026-05-17

Claude ही पहले राजा था, लेकिन Codex 5.5 आने के बाद लगता है कि अब Codex टॉप पर पहुंच गया है.

मैं दोनों इस्तेमाल कर रहा हूं, लेकिन आजकल Claude code लगभग इस्तेमाल ही नहीं करता. लगता है Codex ज़्यादा अच्छा करता है, और सबसे बड़ी बात यह है कि इसके tokens वैसे कम ही नहीं होते.

क्या अगले महीने बारी Gemini की है, जो अभी तक यह ताज हासिल नहीं कर पाया है?

kaydash 2026-05-17

"वास्तविक implementation लगभग 40% ही हुई होती है, लेकिन यह भ्रम पाल लेता है कि काम पूरा हो गया है, या stub/placeholder के आसपास जरूरत से ज़्यादा confidence दिखाता है"
असल completion level को लेकर इसका भ्रम बहुत चिढ़ाने वाला है, और यह बात पूरी तरह relatable लगती है

GN⁺ 2026-05-17

Hacker News की राय

AI tools ऐसे नहीं हैं कि जैसे पसंदीदा sports team चुनकर सिर्फ एक का समर्थन किया जाए। दोनों, या हो सके तो सब सीखकर रखो और इस हफ्ते जो सबसे अच्छा फिट बैठे वही इस्तेमाल करो
अगले महीने यह बदल सकता है। मैं दो subscriptions इस्तेमाल करता हूँ, लेकिन यह भी जानता हूँ कि हर कोई ऐसा नहीं कर सकता
- अभी माहौल सच में ऐसा ही है, लेकिन मुझे लगता है कि यह ज़्यादातर इंसानी प्रवृत्ति की वजह से है, जहाँ कोई दूसरा चुनाव करे तो ऐसा लगता है जैसे वह कह रहा हो कि मैं गलत हूँ
  tools सभी ठीक-ठाक हैं, कुछ लोगों को एक तरफ़ से बेहतर नतीजे मिलते हैं, और जैसा कहा, अगले हफ्ते सब पूरी तरह बदल भी सकता है
- मैं भी इस बात से फ़र्क नहीं पड़ता कि अभी मेरे लिए क्या बेहतर काम कर रहा है, और लगातार test करता रहता हूँ, लगातार experiment करता रहता हूँ
- सही है। models लगातार बदल रहे हैं। आज Anthropic, कल OpenAI, फिर Anthropic, अगले हफ्ते China का नया challenger, और अगले महीने शायद Google संभल जाए। यही चलता रहता है
- मैंने करीब एक हफ्ते Codex और Gemini के साथ काम किया है, और अभी तक Codex मेरे लिए सबसे अच्छा फिट बैठा है
  लेकिन Kinguin पर 18 महीने का premium 15€ coupon मिल गया था, इसलिए Gemini भी इस्तेमाल कर रहा हूँ, और जब quota खत्म होने लगता है तो कुछ काम Gemini को दे देता हूँ
Opus 4.7 ऐसा लगता है जैसे उपयोगी और productive दिखने पर, और दिखावटी performance पर ज़्यादा केंद्रित है
Codex वास्तव में काम पूरा करता है
अच्छा होगा अगर आप अपना workflow थोड़ा और share करें। मैं सीखना चाहता हूँ कि आप क्या और कैसे करते हैं, ताकि उसे follow कर सकूँ
यह भी जानना चाहता हूँ कि आप पूरा repository GPT में क्यों डालते हैं, और कौन-सी techniques और books इस्तेमाल करते हैं
मैं prompt देता हूँ और Codex के खत्म होने का इंतज़ार करता हूँ, फिर उससे दोबारा पूछता हूँ कि क्या उसने आसपास के वे साफ़-साफ़ दिखने वाले काम भी किए हैं जो पहले मैं खुद करता था। तब जाकर वह उन्हें करता है, उसके बाद मैं /review और manual testing पर समय लगाता हूँ, और फिर वापस छोटे task units पर लौट आता हूँ। बड़े features के लिए plan इस्तेमाल करता हूँ, VSCode extension भी इस्तेमाल करता हूँ, और 5.4 और 5.5 दोनों आज़माए हैं, लेकिन पहला मुझे ज़्यादा सूट करता है
यहाँ OpenAI के अलावा दूसरे models कैसे इस्तेमाल कर सकते हैं?
Claude की समस्या यह है कि वह Codex की तरह लगातार चलता नहीं रहता। Claude बेहतर हो सकता है, लेकिन Codex काम को आखिर तक पूरा करने की कोशिश करता है
Claude बस रुक जाता है, और मान लो उसमें वह क्षमता हो भी, तब भी वह इतना महँगा है कि शायद बड़ा फ़र्क न पड़े। शायद वैसा ही हो या बेहतर भी हो, लेकिन अब मुझे ठीक से पता नहीं और मैं उसे इस्तेमाल नहीं कर रहा। 4.5 जब पहली बार आया था तब सबसे बढ़िया था
मुझे भी Codex जादू जैसा लगा था, लेकिन उसके टूटने तक इंतज़ार करो। 3 दिन पहले तक मुझे भी ऐसा ही लगता था, लेकिन अब ईमानदारी से कहूँ तो यह Claude से भी खराब लगने लगा है
मैं 5 Pro accounts के साथ 24 घंटे इस्तेमाल कर रहा हूँ, इसलिए यक़ीन से कह सकता हूँ कि यह 1 हफ्ता पहले वाला नहीं है, और अभी यह सच में बहुत खराब हो गया है
- Altman ने माना कि गुरुवार/शुक्रवार को Codex की हालत बुरी थी, और वे समझने की कोशिश कर रहे हैं कि क्या बदला
- caching issue की वजह से performance गिरी थी, और इस बारे में tweet भी किया गया था। अब rollback कर दिया गया है और कहा गया है कि performance baseline पर वापस आ गई है
- 5 Pro accounts? आपका मतलब Plus accounts है?