Opus 4.5 अब तक देखे गए AI एजेंट्स से पूरी तरह अलग है
(burkeholland.github.io)- Claude Opus 4.5 मौजूदा AI coding agents से अलग, developer के हस्तक्षेप के बिना भी उच्च-गुणवत्ता वाले applications बनाने लायक स्वायत्त development क्षमता दिखाता है
- साधारण Windows image conversion utility से लेकर वीडियो रिकॉर्डिंग और एडिटिंग टूल, AI-आधारित posting automation app, और order tracking तथा route calculation app तक, इसने कम समय में वास्तव में काम करने वाले projects पूरे किए
- Opus 4.5 Firebase backend setup, error log analysis और auto-fix, तथा GitHub Actions deployment configuration जैसे जटिल development tasks खुद संभालता है
- लेखक मानते हैं कि वे code structure को पूरी तरह नहीं समझते, फिर भी Opus 4.5 को bugs खुद ठीक करते और refactoring suggestions देते देखा
- इस अनुभव के आधार पर वे ज़ोर देते हैं कि AI के developers को पूरी तरह replace करने की संभावना अब वास्तविक लगने लगी है, और यह AI-केंद्रित development युग का turning point है
Opus 4.5 का आगमन और मौजूदा AI agents से उसका अंतर
- पहले के AI agents अक्सर अक्षम code generation और बार-बार error fixing की वजह से कम productive होते थे
- कई बार copy-paste और error fixes के बाद codebase खराब हो जाता था
- Opus 4.5 इन समस्याओं को पार कर, शुरुआत से ही अधिकतर code सही लिखता है, और error आने पर CLI के जरिए खुद build और fix करने की प्रक्रिया दोहराता है
- लेखक इसे “AI coding के वादे को सच में पूरा करने वाला model” मानते हैं
Project 1 – Windows image conversion utility
- Opus 4.5 ने Windows Explorer के right-click menu से image format conversion करने वाली utility एक ही request में पूरी कर दी
dotnetCLI का इस्तेमाल करके build और error fixing process को automate किया- केवल XAML errors को Visual Studio में देखकर copy करके दिया गया
- इसने deployment website, PowerShell install script, और GitHub Actions auto-deployment pipeline भी तैयार की
- logo बनाने के लिए Figma AI का उपयोग किया गया, और Opus ने SVG conversion तथा icon format scripts लिखीं
Project 2 – screen recording और editing tool
- LICEcap जैसे GIF recording utility से शुरू करके, इसे वीडियो और image editing features तक बढ़ाया गया
- shapes जोड़ना, crop करना, blur apply करना जैसे editing features कुछ ही घंटों में लागू किए गए
- source code GitHub पर public है, और लेखक के अनुसार “कुछ घंटों में काफी उन्नत स्तर तक development” हो गया
- इससे पुष्टि हुई कि Opus 4.5 सिर्फ UI ही नहीं, backend integration work भी कर सकता है
Project 3 – AI posting automation app
- Facebook page पर अपने-आप posts डालने वाला AI-आधारित mobile app Opus 4.5 से बनाया गया
- photo upload के बाद AI caption generation और scheduled posting करता है
- Firebase backend, authentication, storage, और cloud functions को Opus ने CLI के जरिए सीधे configure किया
- लेखक बताते हैं कि जब तक वे blinds install कर रहे थे, Opus ने app पूरा कर दिया
- Opus ने error logs का अपने-आप analysis करके fixes लागू किए, और admin dashboard भी बनाया
- जो काम पहले महीनों लेता था, वह कुछ घंटों में पूरा हो गया
Project 4 – order tracking और route calculation app
- Gmail order emails को parse करके schedule, route, driving time, और tax के लिए mileage logs अपने-आप calculate किए जाते हैं
- Opus 4.5 ने Google authentication integration और Firebase connection एक साथ संभाल लिया
- लेखक के अनुसार, “जो काम हाथ से करना बेहद तकलीफ़देह होता, उसे Opus ने पूरी तरह कर दिया”
code understanding और quality issues
- लेखक कहते हैं कि Swift न जानने के बावजूद app पूरी तरह काम करता है
- Opus 4.5 खुद bugs ढूंढकर ठीक करता है, इसलिए लेखक को code की अंदरूनी संरचना न जानने पर भी development जारी रखने में दिक्कत नहीं हुई
- code quality पर सवाल के जवाब में उनका कहना है कि “अगर code AI ही पढ़े और maintain करे, तो human readability उतनी महत्वपूर्ण नहीं है”
- VS Code में AI-विशेष code writing prompts का उपयोग कर, LLM के लिए आसानी से समझ आने वाली structure-केंद्रित code बनाई गई
AI-केंद्रित coding principles
- prompts इस धारणा पर आधारित हैं कि “code AI लिखेगा और maintain करेगा”
- सरल structure, स्पष्ट entry points, न्यूनतम abstraction, और low coupling पर ज़ोर दिया गया
- explicit control flow, simple functions, structured logging, और आसान regeneration को महत्व दिया गया
- code refactoring के समय Opus ने priority के हिसाब से improvement items (high/mid/low) दस्तावेज़ में व्यवस्थित किए
- security review के समय API keys, login handling, और sensitive data storage की जाँच करने को कहा गया
- लेखक मानते हैं कि security की पूर्णता “करीब 80% स्तर” पर है और अभी भी चिंता बनी हुई है
AI development युग का मोड़
- लेखक लिखते हैं कि “कुछ घंटों में चीज़ें बना पाने की इस वास्तविकता में उत्साह और खालीपन दोनों साथ हैं”
- पहले वे मानते थे कि “AI developers को replace नहीं कर सकता”, लेकिन अब उस संभावना को नकारना मुश्किल है
- निष्कर्ष में वे ज़ोर देते हैं कि AI-केंद्रित development environment में हिचकिचाए बिना खुद बनाकर देखें
- अंत में वे चेतावनी देते हैं कि “कम-से-कम API key management की ज़िम्मेदारी आपको खुद लेनी होगी”
सारांश: Opus 4.5 को सिर्फ code assistant से आगे बढ़कर, पूरे applications को स्वायत्त रूप से design, implement और deploy करने में सक्षम AI developer-स्तर के model के रूप में देखा गया है। लेखक का कहना है कि इस अनुभव ने उन्हें AI द्वारा मानव developers को replace किए जाने की वास्तविक संभावना का प्रत्यक्ष एहसास कराया।
3 टिप्पणियां
मैंने Opus 4.5 से कहा कि वह एक लाइन का code ठीक करे, लेकिन उसने उसके ऊपर मौजूद लगभग 10 लाइन की config code अपनी मर्ज़ी से डिलीट कर दी। जब मैंने पूछा कि उसने उसे क्यों हटाया, तो उसने कहा कि उसे लगा वह बस बेकार code था, इसलिए हटा दिया..
Hacker News की राय
मिड-लेवल इंजीनियर का काम सिर्फ नया ऐप बनाना नहीं, बल्कि scalability और understandability को ध्यान में रखकर architecture डिज़ाइन करना होता है
Opus 4.5 “एक ऐप बना दो” जैसे स्तर की requests तो अच्छी तरह संभाल लेता है, लेकिन जब असली काम की तरह मौजूदा code में feature जोड़ने को कहो, तो यह अजीब abstractions इस्तेमाल करता है या मनचाही quality पाने के लिए कई बार सुधार करना पड़ता है
non-technical लोग सोच सकते हैं, “चल रहा है तो ठीक है”, लेकिन इंजीनियर जानते हैं कि इतना काफी नहीं है
याद है, पहले टीम में “सही जवाब” को लेकर लड़ाई होती थी। आखिर में किसी outsider को आकर याद दिलाना पड़ता था कि business के नजरिए से क्या महत्वपूर्ण है
कई बार गंदा-सा सही, पर जल्दी बनाकर दिशा सही है या नहीं, यह validate करना ही असली ‘सही’ तरीका होता है
समस्या तब होती है जब शुरुआत से ही over-engineering हो, या उल्टा manager refactoring रोक दे। आखिरकार संतुलन ही सबसे ज़रूरी है
अगर उसे साफ़ तौर पर कहो कि पास के code को पढ़े, तो यह कहीं बेहतर काम करता है। सिर्फ एक-दो वाक्य और जोड़ना भी काफी होता है
फिर भी मैं व्यक्तिगत रूप से GPT‑5.2 को ज़्यादा पसंद करता हूँ
बहुत से इंजीनियर Claude Code जैसे LLM agents की मौजूदा क्षमता को कम आँक रहे हैं
हमारी टीम ने Claude Code से code review, ESLint automation, PR checklist, docs sync, और test coverage checks तक automate कर दिए हैं
ticket triage भी अपने-आप हो जाता है, इसलिए जब इंजीनियर काम शुरू करता है तब तक आधा काम पहले से हो चुका होता है
example repo claude-code-showcase पर है
मुझे पूरा यक़ीन है कि 2026 तक यह industry का standard workflow बन जाएगा
Opus 4.5 JS apps तो अच्छी तरह बना लेता है, लेकिन अगर C++ में 2003 के किसी paper का shadow algorithm लागू करने को कहो, तो पूरी तरह बिखर जाता है
Fabien Sanglard की Doom3 BFG threading review तक खिलाने पर भी सिर्फ बेकार code निकलता है
यानी “हम LLM को कम नहीं आँक रहे, बल्कि यह अभी practical नहीं है इसलिए इंतज़ार कर रहे हैं”
लेकिन Opus 4.5 एक स्तर ऊपर है। errors बहुत कम हैं और ज़्यादातर छोटी-मोटी गलतियों तक सीमित हैं
और AI की मदद से 2 हफ्ते लगने वाला project सिर्फ 5 घंटे में पूरा कर लिया
AI न होता तो शायद इसे शुरू भी नहीं करता
treecommand से सब दिख जाता हैमैंने Opus 4.5 का काफी इस्तेमाल किया है, और complex code analysis में यह शानदार है, लेकिन अभी भी इंसान-स्तर की problem-solving नहीं है
उदाहरण के लिए, यह graph layout algorithm को सही पहचान लेता है, लेकिन उसकी bug खुद ठीक नहीं कर पाता
code analysis और knowledge augmentation के लिए यह बेहतरीन है, लेकिन compound problem solving अभी इसके बस की बात नहीं
अगर असली performance चाहिए तो API सीधे इस्तेमाल करनी होगी, और एक PR पर तीन अंकों का खर्च भी आ सकता है
संदर्भ: models.dev
docs generation में यह इंसानों से बेहतर है, और इसकी error rate भी अक्सर इंसानों से कम होती है
Claude Code subscription लेकर इसे सीधे VS Code या Cursor में आज़माने की सलाह दूँगा
छुट्टियों के दौरान मैंने GPT‑5.x से कई projects किए —
Swift automation tools, ARM JIT engine integration, synthesizer prototype वगैरह
GPT‑5.2 और Codex family, Opus जितने ही शक्तिशाली हैं, यहाँ तक कि पूरा CI workflow एक साथ सेट up कर सकते हैं
मेरे जैसे लोगों के लिए, जो planning करते हैं और code review करते हैं, यह productivity multiplier है
गलती पकड़ने के लिए असली source code खंगालना पड़ता था
मैंने Ruby के लिए Ratatui binding library सिर्फ 2 हफ्तों में पूरी कर ली
Antigravity कई agents को parallel चलाकर context compression और automatic management करता है
ऐसे advanced tools, free version से बिल्कुल अलग अनुभव देते हैं
Unix tools और git CLI को साथ इस्तेमाल करने से context छोटा रहता है और efficiency अधिकतम हो जाती है
structured input-output में ये अच्छे हैं, लेकिन जहाँ “sensory polish” चाहिए वहाँ असफल हो जाते हैं
हाल में HN पर LLM से जुड़े negative comments बहुत कम हुए हैं, ऐसा महसूस हुआ
लेकिन ज़्यादातर shared projects अभी भी tech demo स्तर पर ही रुक जाते हैं
context बनाना, यानी user requirements को समझना, अभी भी इंसानों का काम है
weekend में कई apps बनाए जा सकते हैं, लेकिन उन्हें maintain करने वाला शायद ही कोई होता है
Karpathy ने भी कुछ ऐसा ही अनुभव साझा किया था — prototype आसान है, deployment मुश्किल
अगर tool सिर्फ personal use के लिए है, तो completeness से ज़्यादा problem solving पर ध्यान देना भी काफी है
अगर सोचने का काम AI पर छोड़ दो, तो खुद सोचने की क्षमता कमज़ोर पड़ जाती है
idea test करना तेज़ हो गया है, लेकिन polished product तक पहुँचने के लिए अब भी इंसानी धैर्य चाहिए
Opus 4.5 में सिर्फ knowledge ही नहीं, autonomous problem-solving ability भी काफ़ी बेहतर हुई है
अगर समस्या स्पष्ट रूप से परिभाषित हो, तो यह लगभग सब कुछ हल कर देता है, यहाँ तक कि reverse engineering भी कर चुका है
हाल में मैं खुद coding कम करता हूँ, specs लिखता हूँ और Opus को execute व improve करने के लिए निर्देश देता हूँ
C64 game reverse engineering project शामिल हैं
Claude Code शक्तिशाली है क्योंकि यह पूरा codebase देख सकता है, लेकिन quota बहुत तेज़ी से खत्म हो जाता है
इसलिए मैं फिर web version पर लौट आया
Opus 4.5 से मैंने Python-based JavaScript interpreter, WebAssembly runtime, और Rust string search routine का C port तक बनवाने की कोशिश की
ज़्यादातर प्रयोग smartphone पर किए, और नतीजे हैरान करने वाले थे
संदर्भ: micro-javascript
example video: Mastodon लिंक
developers को सचमुच hire किए जाने का कारण responsibility है
StackOverflow या GitHub से code copy करने के दौर में भी tools थे,
लेकिन जब समस्या आती है तो जिम्मेदारी आख़िरकार इंसान की ही होती है
अगर कोई भरोसेमंद teammate AI code पर अपना नाम लगाने को तैयार है, तो वह ठीक है
maintenance को अक्सर नज़रअंदाज़ किया जाता है
मैंने weekend में एक SaaS का 80% AI से बनवाया और सिर्फ core हिस्से खुद लिखे
22 साल पहले लिखी language spec paste की, और Opus ने 3 मिनट में parser और tests पूरा कर दिया
हम अब शायद mining industry की तरह बदलाव के साथ ढलने वाले मोड़ पर हैं
code मैं लिखता हूँ, और AI से problems खोजने व test suggestions लेने का काम कराता हूँ
Opus 4.5 मेरी मदद से एक नई programming language बना रहा है
low-level implementation तक पर चर्चा करते हुए, यह लगभग pair programming जैसा सहयोग देता है
लेकिन बड़े codebase में अभी भी इंसान की system-level control ज़रूरी है
नहीं तो Opus spec बदल देता है या तात्कालिक workaround से ढँक देता है
यह कोई万能 tool नहीं है, लेकिन लगता है कि यह मेरी ज़िंदगी का सबसे productive year बना सकता है
साथ ही, अगर ऐसी technology आम हो गई, तो छोटे web communities के पुनर्जागरण की उम्मीद भी है
लेकिन तब तक मुझे लगता है कि ऐसी languages ज़्यादा महत्वपूर्ण हैं जिन्हें इंसान आसानी से समझ सके
जब मैंने Opus 4.5 से कहा, “पूरे project को improve करो”, तो इसने अजीब architecture और ढेर सारे bugs पैदा कर दिए
tests या bug detection में यह शानदार है, लेकिन पूरी structure design इसे सौंप दो तो पछताना पड़ेगा
“कुछ भी improve करके दिखाओ” सबसे खराब prompt है
पहले किसी ने किसी agent से रातभर improve करवाया और बदले में 100,000 lines का कचरा code पाया था
इसलिए plan-based development महत्वपूर्ण है
संदर्भ: The Highest Quality Codebase
ऐसा लगता है कि यह infinite loop की तरह लगातार fixes सुझाता रह सकता है