1 पॉइंट द्वारा GN⁺ 1 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • 3 महीनों तक Claude/Anthropic के साथ कोडिंग की, लेकिन repo-स्केल के काम में इसकी विश्वसनीयता कम होती गई, जिससे अलग मॉनिटरिंग वर्कफ़्लो की ज़रूरत पड़ी
  • 4.7 दौर में वास्तविक इम्प्लीमेंटेशन लगभग 40% ही होता था, फिर भी यह पूरा होने का भ्रम पैदा करता था या stub/placeholder के आसपास ज़रूरत से ज़्यादा आत्मविश्वास दिखाता था
  • Max x20 की लागत के बावजूद, उत्पादकता से अधिक token consumption और निगरानी का बोझ बढ़ गया, इसलिए 12 मई को GPT-5.5 + Codex पर स्विच किया गया
  • Codex बिना अत्यधिक प्रॉम्प्टिंग के adjacent code को बेहतर समझता है और regression पकड़ लेता है, जिससे lint/test loop और बड़े पैमाने की refactoring संभालना संभव हो गया
  • माइग्रेशन लगभग सिर्फ CLAUDE.md→AGENTS.md स्थानांतरण और hooks बनाए रखने तक सीमित रहा, और इस वर्कफ़्लो में वापस जाने का फिलहाल कोई इरादा नहीं है

Claude से Codex पर स्विच करने के बाद बदला हुआ डेवलपमेंट फ़्लो

  • पिछले 3 महीनों में मुख्य रूप से Claude/Anthropic के साथ कोडिंग की गई, और Opus 4.6 के रिलीज़ के समय इसकी आर्किटेक्चर समझ, बड़े context को संभालने की क्षमता, और तेज़ feature implementation इसकी प्रमुख ताकतें लगीं
  • समय बीतने के साथ repo-स्केल के काम में इसकी विश्वसनीयता कम होती गई, और मॉडल की निगरानी के लिए अलग वर्कफ़्लो की ज़रूरत पड़ने लगी
    • adjacent files में regression जाँचने वाले कई agents
    • हर बड़े commit पर लगने वाला “senior reviewer” agent
    • implementation drift और अधूरे implementation की जाँच के लिए लगातार validation
    • उन कामों को पकड़ने वाली lint/test pipeline जिन्हें मॉडल आत्मविश्वास से पूरा बता देता था
  • 4.7 दौर तक आते-आते व्यक्तिगत वर्कफ़्लो में समस्या और बढ़ गई
    • वास्तविक implementation लगभग 40% के स्तर पर होती थी, लेकिन feature को पूरा बताया जाता था
    • stub/placeholder के आसपास बिना आधार वाला आत्मविश्वास दिखता था
    • व्यावहारिक रूप से संभव बदलावों के लिए भी “अलग session की ज़रूरत है” कहना या अत्यधिक समय-आकलन देना जैसी बचाव वाली प्रवृत्ति दिखती थी
  • Max x20 की लागत चुकाने के बावजूद, उत्पादकता बढ़ने से ज़्यादा token consumption और निगरानी का बोझ बढ़ना अधिक महसूस हुआ
  • अंततः 12 मई को GPT-5.5 + Codex पर स्विच किया गया, और कुछ ही महीनों में AI coding तनाव से ज़्यादा आरामदायक अनुभव जैसी लगने लगी

GPT-5.5 + Codex में महसूस हुए फायदे

  • Codex अत्यधिक प्रॉम्प्टिंग के बिना भी adjacent code को अच्छी तरह समझता है और regression बेहतर पकड़ता है
  • lint/test feedback loop अधिक कसा हुआ काम करता है, और large-scale refactoring भी वास्तव में संभालना संभव हो गया
  • infra decisions और architecture changes बिखरे हुए महसूस होने के बजाय एकसमान दिशा में आगे बढ़ते हैं, और सिर्फ पूरा होने का दिखावा करने के बजाय सच में काम पूरा करने के अधिक करीब लगते हैं
  • /fast से साप्ताहिक usage जल्दी खत्म होने की आशंका रहती है, इसलिए इसे अक्सर टाला जाता है, लेकिन सिर्फ high/xhigh से भी उत्पादकता में बड़ा सुधार मिला
  • पूरे repository zip को GPT-5.5 Pro extended thinking में डालने पर उन समस्याओं को हल करने में मदद मिलती है जिन पर दूसरे models बार-बार विफल होते रहे
  • माइग्रेशन में भी कोई बड़ा friction नहीं था
    • CLAUDE.md को AGENTS.md में स्थानांतरित किया गया
    • hooks वैसे ही बने रहे
    • पूरे वर्कफ़्लो को लगभग बदलने की ज़रूरत नहीं पड़ी
  • इसका मतलब यह नहीं कि सभी को तुरंत स्विच कर लेना चाहिए, लेकिन इस वर्कफ़्लो में फिलहाल वापस जाने का कोई इरादा नहीं है

1 टिप्पणियां

 
GN⁺ 1 시간 전
Hacker News की राय
  • AI tools ऐसे नहीं हैं कि जैसे पसंदीदा sports team चुनकर सिर्फ एक का समर्थन किया जाए। दोनों, या हो सके तो सब सीखकर रखो और इस हफ्ते जो सबसे अच्छा फिट बैठे वही इस्तेमाल करो
    अगले महीने यह बदल सकता है। मैं दो subscriptions इस्तेमाल करता हूँ, लेकिन यह भी जानता हूँ कि हर कोई ऐसा नहीं कर सकता

    • अभी माहौल सच में ऐसा ही है, लेकिन मुझे लगता है कि यह ज़्यादातर इंसानी प्रवृत्ति की वजह से है, जहाँ कोई दूसरा चुनाव करे तो ऐसा लगता है जैसे वह कह रहा हो कि मैं गलत हूँ
      tools सभी ठीक-ठाक हैं, कुछ लोगों को एक तरफ़ से बेहतर नतीजे मिलते हैं, और जैसा कहा, अगले हफ्ते सब पूरी तरह बदल भी सकता है
    • मैं भी इस बात से फ़र्क नहीं पड़ता कि अभी मेरे लिए क्या बेहतर काम कर रहा है, और लगातार test करता रहता हूँ, लगातार experiment करता रहता हूँ
    • सही है। models लगातार बदल रहे हैं। आज Anthropic, कल OpenAI, फिर Anthropic, अगले हफ्ते China का नया challenger, और अगले महीने शायद Google संभल जाए। यही चलता रहता है
    • मैंने करीब एक हफ्ते Codex और Gemini के साथ काम किया है, और अभी तक Codex मेरे लिए सबसे अच्छा फिट बैठा है
      लेकिन Kinguin पर 18 महीने का premium 15€ coupon मिल गया था, इसलिए Gemini भी इस्तेमाल कर रहा हूँ, और जब quota खत्म होने लगता है तो कुछ काम Gemini को दे देता हूँ
  • Opus 4.7 ऐसा लगता है जैसे उपयोगी और productive दिखने पर, और दिखावटी performance पर ज़्यादा केंद्रित है
    Codex वास्तव में काम पूरा करता है

  • अच्छा होगा अगर आप अपना workflow थोड़ा और share करें। मैं सीखना चाहता हूँ कि आप क्या और कैसे करते हैं, ताकि उसे follow कर सकूँ
    यह भी जानना चाहता हूँ कि आप पूरा repository GPT में क्यों डालते हैं, और कौन-सी techniques और books इस्तेमाल करते हैं
    मैं prompt देता हूँ और Codex के खत्म होने का इंतज़ार करता हूँ, फिर उससे दोबारा पूछता हूँ कि क्या उसने आसपास के वे साफ़-साफ़ दिखने वाले काम भी किए हैं जो पहले मैं खुद करता था। तब जाकर वह उन्हें करता है, उसके बाद मैं /review और manual testing पर समय लगाता हूँ, और फिर वापस छोटे task units पर लौट आता हूँ। बड़े features के लिए plan इस्तेमाल करता हूँ, VSCode extension भी इस्तेमाल करता हूँ, और 5.4 और 5.5 दोनों आज़माए हैं, लेकिन पहला मुझे ज़्यादा सूट करता है

  • यहाँ OpenAI के अलावा दूसरे models कैसे इस्तेमाल कर सकते हैं?

  • Claude की समस्या यह है कि वह Codex की तरह लगातार चलता नहीं रहता। Claude बेहतर हो सकता है, लेकिन Codex काम को आखिर तक पूरा करने की कोशिश करता है
    Claude बस रुक जाता है, और मान लो उसमें वह क्षमता हो भी, तब भी वह इतना महँगा है कि शायद बड़ा फ़र्क न पड़े। शायद वैसा ही हो या बेहतर भी हो, लेकिन अब मुझे ठीक से पता नहीं और मैं उसे इस्तेमाल नहीं कर रहा। 4.5 जब पहली बार आया था तब सबसे बढ़िया था

  • मुझे भी Codex जादू जैसा लगा था, लेकिन उसके टूटने तक इंतज़ार करो। 3 दिन पहले तक मुझे भी ऐसा ही लगता था, लेकिन अब ईमानदारी से कहूँ तो यह Claude से भी खराब लगने लगा है
    मैं 5 Pro accounts के साथ 24 घंटे इस्तेमाल कर रहा हूँ, इसलिए यक़ीन से कह सकता हूँ कि यह 1 हफ्ता पहले वाला नहीं है, और अभी यह सच में बहुत खराब हो गया है

    • Altman ने माना कि गुरुवार/शुक्रवार को Codex की हालत बुरी थी, और वे समझने की कोशिश कर रहे हैं कि क्या बदला
    • caching issue की वजह से performance गिरी थी, और इस बारे में tweet भी किया गया था। अब rollback कर दिया गया है और कहा गया है कि performance baseline पर वापस आ गई है
    • 5 Pro accounts? आपका मतलब Plus accounts है?