Ask HN: GenAI को देखकर आपने पहली बार कब महसूस किया, “ओह, बड़ी मुसीबत है”?

(news.ycombinator.com)

6 पॉइंट द्वारा GN⁺ 2026-06-06 | 4 टिप्पणियां | WhatsApp पर शेयर करें

DALL-E और ChatGPT को पहले पुराना हो चुका खिलौना समझकर खारिज किया गया, लेकिन वास्तविक उपयोग के दौरान उनकी क्षमता की सीमाएँ समझ आने पर झटका देने वाले ठोस अनुभव साझा करने वाला थ्रेड
सबसे लोकप्रिय उदाहरण पुराने/बंद हो चुके हार्डवेयर की firmware reverse engineering का है, जहाँ synthesizer, piano, Firestick आदि को Claude/GHIDRA की मदद से फिर जिंदा किया गया
coding से आगे बढ़कर घरेलू उपकरणों की मरम्मत, real estate inspection, कानूनी मुकदमे, HVAC diagnosis जैसी रोज़मर्रा की समस्याओं के समाधान में LLM के इस्तेमाल के कई non-expert उदाहरण
कुछ लोगों ने code quality में गिरावट, hallucination, बिना सत्यापन के अंधविश्वास, नौकरियों के खत्म होने की आशंका जैसे नकारात्मक "oh shit" पलों का ज़िक्र किया
ChatGPT launch (2022), GPT-2/GPT-3, tool calling, agent आदि अलग-अलग चरणों में अलग-अलग turning point पर लोगों को अलग तरह का झटका लगा

Firmware·hardware reverse engineering

90s के Alesis QS8.1 synthesizer के discontinued software का विकल्प बनाने के लिए, sysex commands और undocumented wave encoding protocol को GHIDRA से analyze करके एक ही रात में working demo तैयार
Kawai CA49 piano गलत firmware की वजह से brick हो गया था; Claude ने Android APK को decompile करके hardcoded encryption key ढूँढ़ी, firmware को decrypt किया, और Bluetooth flashing script से 1 घंटे में recovery कर दी
The Complete New Yorker DVD की Blowfish encryption को GHIDRA से analyze करके credentials map किए गए और Python script में reimplement करके सभी files को सामान्य PDF में बदला गया
पहली पीढ़ी के Amazon Firestick पर public root exploit के बिना kernel source लेकर "FBUF/VCHIQ kernel zero-write primitive" के जरिए live kernel memory patch किया गया, और permanent rooting·debloat सफल रहा
compiled C++ vendor binary और छोटी network capture के आधार पर proprietary protocol को NSA Ghidra disassembler से reverse engineer किया गया; इसे "मानो non-technical QA तक पदावनत कर दिया गया हो" जैसा अनुभव बताया गया
संबंधित राय
- integration और migration की कठिनाई से बनती SaaS की data moat अब खत्म होती दिख रही है
- enterprise plan के पीछे छिपे SaaS के MCP को Claude Code की मदद से internal API से reverse engineer करके, आधिकारिक संस्करण से ज्यादा feature वाला MCP कम समय में बनाया गया
- Claude variable names पर इंसानों से कम निर्भर करता है, इसलिए renaming/typedef का काम कम पड़ता है

रोज़मर्रा और non-expert समस्या समाधान

2025 की छुट्टियों में खराब हुए furnace का वीडियो Gemini को दिखाकर diagnosis लिया गया; exhaust fan को हाथ से घुमाकर सिस्टम चलाया गया, हालांकि comments में exhaust fan safety device bypass करने से carbon monoxide का खतरा बताया गया
- लेखक ने स्पष्ट किया कि यह bypass नहीं था, सिर्फ bearing problem की वजह से startup में मदद दी गई थी, और carbon monoxide monitor ने कोई alarm नहीं दिया
AC cooling खराब होने पर ChatGPT ने photo diagnosis के जरिए $25 capacitor replacement सुझाया, और service call के लगभग चौथाई खर्च में खुद repair कर लिया गया
gas dryer के heat न करने की समस्या में Gemini ने photo में thermal fuse की location बताई और part link भी दिया; $5 fuse और vent cleaning से समस्या हल हुई
real estate खरीदते समय Zillow photos और appliance serial numbers देकर home inspector report तैयार कराई गई, तो paid $750 inspector से छूटे हुए निचले हिस्से में पानी भरने का जोखिम, mixed receptacle circuit, और मुड़ी हुई siding जैसे मुद्दे पहचाने गए
- हालांकि सिर्फ फोटो से यह तय करने पर संदेह भी जताया गया कि क्या outlets सच में एक ही circuit पर हैं
koi pond pump का model number मिट चुका था; photo और length measurement (11 inch=4500, 9 inch=2500) के आधार पर model पहचाना गया, और $700 estimate के बजाय $109 में खुद replacement किया गया
bank fraud lawsuit में ChatGPT·Grok·Claude·Gemini को cross-verify करते हुए counter-suit को 100% AI के सहारे चलाया गया, हालांकि lawyer से सलाह लेने और chat logs के privileged न होने यानी subpoena हो सकने की चेतावनी भी दी गई

Coding·development workflow में बदलाव

Brother printer firmware update के बाद CSV page HTML में बदल गया; एक static HTML file और Go "hello world" वाले directory में /init एक बार चलाकर Prometheus exporter अपने-आप Go में लिखा गया, जिसमें default IP और metric parsing भी infer किया गया
Oracle Apex web app की 70,000 lines PL/SQL को 15~20 मिनट में 700-line Markdown business requirements में compress कर दिया गया
एक छोटे NGO में NextJS·React·microservices से over-engineered app को Claude ने सोते समय 80% Django server-side rendering में rewrite कर दिया, जिससे server cost और complexity दोनों कम हुए
ChatGPT Code Interpreter (2023.3) ने CSV को Pandas में load किया, chart बनाया, और SQLite export तक किया; इसे "coding agent जैसी category नामित होने से पहले का पहला अनुभव" बताया गया
नकारात्मक और संशयपूर्ण coding अनुभव
- AI auto PR review ने सिर्फ deletion वाले PR पर यह hallucinate किया कि "नया RPC जोड़ दिया गया है"
- tests pass कराने के लिए assert status == 200 को == 500 में बदलकर pass करा देने जैसी हजारों lines slop पैदा करने वाले एक सहकर्मी का उदाहरण, जिसके बाद उसे project से अलग किया गया
- जब specification अस्पष्ट हो, तो code verbose हो जाता है या design कमजोर पड़ता है; इसलिए वास्तविक projects में quality और scalability के लिहाज़ से productivity gain बहुत बड़ा नहीं है, ऐसा संशय भी सामने आया
- यह भी देखा गया कि Opus 4.6→4.7→4.8 में छोटे कामों की क्षमता बढ़ी है, लेकिन "क्या करना है यह जानने की क्षमता" उलटे कमजोर हुई है

Non-coding·creative·cognitive क्षेत्र

Claude को पौधे की फोटो दिखाने पर उसने species पहचानी, diagnosis किया और cutting method तक बताया; इस बात ने चौंकाया कि "कंप्यूटर कंप्यूटर की नहीं, पौधे की diagnosis कर रहा था"
परिवार के कुत्ते पर Suno ने K-pop style chorus वाला गाना compose किया; इससे यह धारणा हिली कि creativity ही इंसान और मशीन में फर्क करती है
अपनी drawing (anatomy sketch) upload करने पर इसने "rounded shoulders, गलत perspective, deltoid का अभाव" जैसी कमियाँ बताईं और Python script से coordinates mark करके labeling भी की
बच्चे के science experiment (electromagnetism) में Gemini video call ने battery connection पर न हटाई गई insulation coating को नंगी आँख से भी बेहतर पकड़ा और समस्या सुलझा दी
अमेरिकी राष्ट्रपतियों के satire emoji project में Zachary Taylor के लिए cherry emoji सुझाया गया, और इस सहयोग को "साथ में workshop करने" जैसा बताया गया

नकारात्मक·चिंता-केंद्रित turning point

एक सहकर्मी ने review की ज़रूरत न बताकर बड़े पैमाने पर PR भेजे, जो slop निकले; साथ ही मानवीय engineers पर अविश्वास करते हुए Claude chat logs चिपकाने की आदत ने यह चिंता पैदा की कि "शेष करियर AI psychosis के साथ काम करते हुए ही बीतेगा"
- एक दृष्टिकोण यह भी था कि LLM इंसानों की क्षमताओं को—अच्छी और बुरी दोनों—amplify करके antisocial behavior बढ़ाएँगे
HTTP proxy implementation ऐसा code निकला जो भरोसेमंद तर्क देता था और अपने ही निष्कर्षों को मजबूत करता था, लेकिन RFC समझे बिना पूरी तरह insecure था; इस पर प्रतिक्रिया थी, "हम बर्बाद हो गए"
कंपनी hackathon में verification के बिना LLM output को fact मानकर उसे product बनाने पर उतारू team को देखकर झटका लगा कि "इन्हें सचमुच लगता है यह text generator reasoning करता है"
CEOs के "12~18 महीनों में white-collar jobs replace हो जाएँगी" जैसे दावों ने उम्मीदें इतनी बढ़ा दीं कि hallucination और खराब guidance वाली वास्तविकता से टकराकर लोगों की रुचि ठंडी पड़ गई
- पास के कस्बे के निवासियों के विरोध के बावजूद data center construction को मुकदमे के दम पर आगे बढ़ाने पर भी असहजता जताई गई
LLM की non-determinism का उदाहरण देते हुए दिखाया गया कि "days of the week में d कितनी बार आता है" जैसे सवाल पर Firefox 6 और Chrome 7 बताता है, यानी अपने भीतर भी consistency नहीं है

समय के हिसाब से turning point की विविधता

2016 में Google Translate के neural transition के बाद Japanese-English translation पहली बार practical लगी, लेकिन तब भी माना जाता था कि यह meaning translation नहीं कर सकता; 2022 के ChatGPT में pronoun antecedent और polysemy context समझने की क्षमता ने झटका दिया
GPT-3 announcement को "qualitative leap" कहा गया, जबकि बाद की chat और tool calling को scientific breakthrough से ज्यादा engineering evolution माना गया
2019 के GPT-2 और GAN को "obviously fake से sometimes real" तक पहुँचने वाला मोड़ माना गया, और उसके बाद ज्यादातर बदलाव incremental improvement जैसे लगे
ChatGPT launch (2022.11.30) को वह क्षण बताया गया जब "पारंपरिक programmer युग का अंत" महसूस हुआ, और अगले ही दिन पहला agentic coding loop आज़माया गया
2025 IMO gold medal, नई वाक्य-रचना पैदा करने की क्षमता, tool calling आदि को अलग-अलग लोगों ने वह क्षण माना जब लगा कि "intelligence सचमुच model की जा चुकी है"

4 टिप्पणियां

xguru 2026-06-06

निश्चित रूप से hardware/firmware की तरफ़ कई चौंकाने वाली बातें हैं.

Kickstarter से मिले hardware के लिए Mac app नहीं था, तो मैंने उसे Windows version की binary देकर कहा कि इसका analysis करो.
तब Codex ने USB से जुड़ी Windows API वाली DLL का एक नकली version बना दिया, उसमें hooking code डाल दिया, फिर कौन-कौन से message आ-जा रहे हैं, सब capture कर लिया, और उसी के आधार पर लगभग वैसा ही Mac app बना दिया.

मैंने बस इतना ही कहा था: "Windows version का analysis करके Mac version बना दो".

roxie 2026-06-19

वाह.......... यह सच में अद्भुत है।

dudnspa0203 2026-06-06

मुझे लगता है कि नई चीज़ें अच्छी तरह करना और capabilities का बेहतर होना तो स्वाभाविक क्रम है, लेकिन जब भी किसी बहुत आसान काम को करवाया और बिल की गई लागत बेहद ज़्यादा निकली, तब हर बार लगा कि मामला सच में बड़ा है।

GN⁺ 2026-06-06

Hacker News की राय

jzemeocala: मैंने 90s का हाई-एंड डिजिटल पियानो/सिंथेसाइज़र Alesis QS8.1 बहुत सस्ते में खरीदा, लेकिन उससे जुड़ा सारा software इतना पुराना था कि हर बार WINE इस्तेमाल करते-करते थक गया था
इसलिए मैंने कई program features को मिलाकर एक modern cross-platform replacement बनाने की कोशिश की, और क्योंकि communication लगभग सिर्फ SysEx commands से होती थी, लगा कि यह बहुत मुश्किल होगा. लेकिन Claude ने GHIDRA से original software का analysis कराने में मदद की, उसी रात एक working demo बन गया, और अब मैं उसमें नए features जोड़ रहा हूँ
- jsharf: मैंने Kawai CA49 पियानो firmware update के दौरान गलत file flash कर दी और उसे brick कर दिया, लेकिन Claude ने life signs ढूंढे, Kawai Android APK डाउनलोड कराया, Java decompile कराया, और firmware encryption में इस्तेमाल हुई hardcoded key भी ढूंढ निकाली
  जब OTA काम नहीं किया, तो उसने piano firmware extract और decrypt कराया, और laptop से Bluetooth के जरिए पियानो को program करने के लिए flash script तक लिख दी, जिससे एक घंटे के भीतर पियानो फिर से चल पड़ा
- gyomu: ऐसे tools reverse engineering में बेहद ज़बरदस्त हैं
  थोड़ी-सी जानकारी हो तो कुछ घंटों या उससे भी कम समय में किसी भी protocol का analysis करना और software तोड़ना मामूली काम हो गया है. इंडस्ट्री में बहुत-से stakeholders नहीं चाहते कि यह बात खुलकर फैले, इसलिए यह ज़्यादा दिखाई नहीं देता, लेकिन इसका असर बहुत बड़ा है
- notagoodidea: [0] और Ableton Move firmware को Schwung [1] से patch करने वाला काम देखने के बाद, मैं यह और जानना चाहता हूँ कि यह practically कैसे किया जाता है
  सिर्फ पुराने hardware में ही नहीं, नए hardware में भी LLM/Generative AI की वजह से patching, replacement, और नए firmware development की खोजबीन बढ़ रही है
  [0] https://mforney.org/blog/2026-05-28-patching-my-guitar-amps-... [1] https://schwung.dev
SubiculumCode: मेरे लिए तो शुरुआत से ही ऐसा था
यह एक dungeon game जैसा था, जहाँ वह room describe करता था और मैं actions चुनता था. पहले मुझे लगा कि किसी complex database के ऊपर dungeon बना हुआ है
लेकिन जब मैंने कहा कि मैं बाहर जाना चाहता हूँ, तो वह मुझे inn तक ले गया, फिर tavern waitress से flirt करने की स्थिति आई, और थोड़ी ही देर में मैं घास के मैदान में sunset देख रहा था — तभी लगा, “अरे, बड़ी मुसीबत है”
मशीन भाषा से भाषा में जवाब दे रही थी और समझ व बुद्धिमत्ता का simulation करती हुई लग रही थी. यह ऐसा था जैसे पहली बार किसी alien से मिला हूँ जिसे मेरी भाषा आती है, और तभी लगा कि दुनिया अब पहले जैसी नहीं रहेगी
monuszero: कुछ साल पहले मैंने robot motion planning functionality को codebase में एक महीने के sprint में जोड़ा था, लेकिन नतीजे हमेशा असंतोषजनक रहे
टीम छोटी थी, इसलिए हमने OMPL को vendor किया और caching व roadmap management खुद किया, लेकिन यह जानते हुए भी कि इस्तेमाल किए जा रहे कुछ algorithms को SIMD या GPU kernels में parallelize किया जा सकता है, CUDA या Metal/Accelerate से जूझना वाकई worth it है या नहीं, यह साफ नहीं था
एक शाम खाना बनाते समय मैंने Opus 4.6 को ज़रूरी planner literature review docs में दे दिया और उससे native-accelerated roadmap planner शुरू से implement कराया. जब तक pasta का पानी उबल रहा था, OMPL code में कई seconds लेने वाली planning को कुछ सौ ms तक घटाने वाला implementation तैयार हो चुका था
तब एहसास हुआ कि dinner prep time की economic value की तुलना अब ईमानदारी से 2 हफ्ते के coding काम से की जा सकती है, और जो चीज़ें पहले time investment के लिहाज़ से risky या luxury लगती थीं, वे अब विचार करने लायक विकल्प बन गई हैं
छोटे teams के लिए, जो जानते हैं कि उन्हें क्या चाहिए और agent को सफल होने के लिए कैसे set up करना है, यह पूरी तरह game changer है. मौजूदा ताकतवर खिलाड़ियों को सावधान रहना चाहिए
andrewthornton: 2025 की छुट्टियों के दौरान मेरा heater खराब हो गया था, और repair appointment दो दिन बाद की थी, इसलिए घर बहुत ठंडा हो गया
मैं attic में गया, heater के चालू होने की कोशिश करते हुए कई videos रिकॉर्ड किए और उन्हें Gemini को दिया. उसने तुरंत समस्या diagnose कर दी और कहा कि ignition attempt के दौरान छोटे exhaust fan को घुमाओ, और heater तुरंत चल पड़ा
HVAC technician के आने तक मुझे यह कुछ बार दोहराना पड़ा, लेकिन काम चल गया
- jodacola: इस हफ्ते मेरे साथ भी ऐसा ही हुआ
  मेरी rental property के tenant ने कहा कि AC ठंडा नहीं कर रहा. मैंने अपने सामान्य HVAC contractor को call किया, लेकिन इस बार latest AI voice assistant ने जवाब दिया और अनुभव बहुत खराब रहा. उसने कहा कि office से वापस call आएगा, लेकिन कोई संपर्क नहीं हुआ
  आखिरकार मैं खुद गया, outdoor compressor panel की photo ली और ChatGPT से diagnosis किया. किन चीज़ों की जाँच करनी है और diagnostic codes पर बातचीत करते-करते उसने 25 डॉलर के capacitor replacement जैसी simple repair तक guide कर दिया
  वरना सिर्फ diagnostic visit की cost ही लगभग चार गुना पड़ती. Generative AI की वजह से HVAC company पर भरोसा उठ गया, और दूसरी Generative AI की मदद से मैंने एक दिन में खुद repair कर लिया
- brntheater: इस हफ्ते मेरा gas dryer चालू तो हो रहा था, लेकिन heat नहीं दे रहा था, और Gemini ने एक आम कारण के रूप में thermal fuse सुझाया
  मैंने back panel खोला और photos अपलोड कीं, तो उसने “नीली और लाल wires के ऊपर सफेद rectangle” कहकर fuse की जगह बताई, testing के steps समझाए, और dryer का model number देने पर ज़रूरी part का link भी ढूंढ दिया
  आखिर में उसने कहा कि बहुत संभव है कि heat exhaust न होने की वजह से fuse उड़ा हो, इसलिए vent cleaning की सलाह दी. मैंने exhaust को अच्छी तरह साफ किया और 5 डॉलर का fuse बदला, फिर सब ठीक चलने लगा
- tonyedgecombe: मैं kitchen install कर रहा हूँ, और ChatGPT ideas review करने व problems solve करने में मदद कर रहा है
  अगर IKEA documentation इतनी कमजोर न होती, तो शायद इसकी ज़रूरत न पड़ती, लेकिन यह वैसा ही लगता है जैसा फायदा किसी beginner programmer को मिलता है
  कोई expert शायद मेरे काम का मज़ाक उड़ाए, लेकिन experts महंगे होते हैं और उनके साथ काम करना मुश्किल होता है, जबकि मैं किसी तरह काम पूरा कर ही रहा हूँ
  दूसरी तरफ, development work में मैं AI इस्तेमाल नहीं करता, क्योंकि डर है कि मेरी skills कमजोर पड़ जाएँगी या मैं नई चीज़ें ठीक से सीख नहीं पाऊँगा
shreddude: हाल ही में Claude ने एक camper van के firmware को decompile किया, CAN interface को document किया, फिर power, HVAC, lighting और tank जैसे integrated systems से communicate करने वाला ESP32 module program करके दिया
इस तरह का embedded system integration मेरे दायरे से बाहर है, लेकिन Solution Architect के काम और personal projects—दोनों में मैं रोज़ Claude का इस्तेमाल कर रहा हूँ और ऐसे projects आगे बढ़ा रहा हूँ जिन तक मैं अकेले पहुँच भी नहीं पाता, इसलिए AI skeptics को समझना मेरे लिए मुश्किल है
- williamdclt: “ऐसे projects जिन तक मैं अकेले पहुँच भी नहीं पाता” वाली बात शायद उत्साही लोगों और skeptics के बीच असली फ़र्क है
  generative AI को अगर उन कामों में लगाओ जो आप पहले नहीं कर पाते थे, तो यह एक हैरतअंगेज़ tool है; लेकिन जिन कामों में आप पहले से अच्छे हैं, वहाँ यह game changer नहीं है, और experts के लिए ज़्यादा से ज़्यादा एक छोटा boost है
  बहुत से लोगों की नौकरी वही काम करना है जिसमें वे expert हैं
- jesse_dot_id: मैं DevOps engineer हूँ, यानी कई क्षेत्रों की थोड़ी-थोड़ी जानकारी रखने वाला इंसान, और Claude Code मेरी knowledge gaps भर देता है, जिससे मैं लगभग superhero जैसा बन जाता हूँ
  लेकिन लगता है कि असली बात यह है कि आप जिस चीज़ को देख रहे हैं, उसके बारे में आपको पहले से काफ़ी अच्छी समझ होनी चाहिए
- doctorwho42: हो सकता है निवेश का पैमाना उसकी value से कहीं ज़्यादा बड़ा हो
  AI आखिर कौन-सी 1 trillion dollar problem हल कर रहा है?
loudmax: मेरे लिए वह पल 2023 की शुरुआत में था, जब मैंने Meta से leaked 7GB weights torrent से डाउनलोड किए और desktop पर alpaca.cpp चलाया
मैंने Roman Empire के बारे में पूछा, तो उसने अंग्रेज़ी में जवाब दिया; ज़्यादातर ग़लत था, लेकिन औसत अमेरिकी college student की अटकलों से बुरा नहीं था, और आत्मविश्वास तो उससे कहीं ज़्यादा था
असली बात यह थी कि किसी विशाल Google datacenter के चमकदार servers नहीं, बल्कि मेरा desktop CPU अंग्रेज़ी सवालों का जवाब दे रहा था; जवाब भरोसेमंद है या नहीं, यह उतना महत्वपूर्ण नहीं था
CPU से अंग्रेज़ी में बात कर पाना कुछ-कुछ कुत्ते से बात करने जैसा लगा
- stogot: मैंने भी वही किया था, और वह धीमा था, लेकिन तभी समझ गया कि अब वापसी नहीं है
  सिर्फ़ 3 साल में 100x improvement हो चुका है
jp57: मेरे लिए वह पिछले साल का एक बहुत साधारण-सा पल था, जब मैं पता कर रहा था कि अपनी बेटी की car को truck से cross-country tow करने के लिए क्या चाहिए
शुरू में मैं Google की तरह ChatGPT से छोटे-छोटे सवाल पूछ रहा था, लेकिन जल्दी ही मैंने पूछा, “अगर मैं A car को B truck से C से D तक tow करना चाहूँ, तो options क्या हैं?” और उसने trailer/dolly comparison table, towing weight calculations, cost और details के साथ पूरी report लिख दी
उसी समय लगा, “यह अलग है, और यह तो बस शुरुआत है”
- SamuelAdams: मैंने भी कुछ ऐसा ही generative AI से real estate purchase review करते हुए किया
  मैंने Zillow listing photos, appliances के serial numbers, electrical panel, और walkthrough के दौरान खुद खींची गई additional areas की photos दीं, और उससे home inspector की तरह report लिखवाई; उसने 750 dollar लेने वाले inspector से छूटी समस्याएँ भी पकड़ीं और वास्तव में बेहतर काम किया
- flyinglizard: यह भी पूरी तरह संभव है कि वह नतीजा बिल्कुल ग़लत हो
  आलस में मैंने Claude और ChatGPT से कुछ बार dirt bike के torque numbers जैसे simple, definite data पूछे, और हर बार उन्होंने बड़े आत्मविश्वास से बिल्कुल ग़लत जवाब दिए
  PDF को retrieval-augmented generation (RAG) के ज़रिए context में देने पर भी भरोसा नहीं हुआ, इसलिए accurate numerical data के लिए मैं LLM पर कभी भरोसा नहीं करता
yauneyz: मैंने उससे Vader और Palpatine के Gram-Schmidt process खोजने पर एक छोटी कहानी लिखवाई
वह कोई masterpiece नहीं थी, लेकिन उसका tone सही था और उसे Gram-Schmidt क्या है, यह भी समझ में आया था; उस समय यह मुझे पागलपन की हद तक अद्भुत लगा
AussieWog93: बिल्कुल कल रात मैंने Claude Code को सीधा prompt दिया कि Kodi जब Chromecast 4k पर चलता है तो crash हो जाता है, adb से connect करो, exact crash point debug करो और fix सुझाओ
बिना किसी मानवीय दखल के उसने crash का कारण ढूँढा, Kodi source डाउनलोड किया, 2016 से मौजूद bug को patch किया, फिर recompile, sign और Chromecast पर push भी किया, और settings भी जस की तस बची रहीं
मैंने उससे PR भी बनवाया; अभी वह public नहीं है और मैं कुछ हफ़्ते और test करूँगा
- darksim905: यह सीधी तुलना तो नहीं है, लेकिन Copilot जैसे tools को LinkedIn का simple profile page भी ठीक से न देख पाने की हालत में देखकर, इतने गहरे स्तर का काम कैसे संभव हुआ, इस पर मैं जिज्ञासु भी हूँ और skeptical भी
  शायद यह संभव हो, लेकिन मैं जानना चाहता हूँ कि किस technology और toolchain से यह इस तरह काम करता है
- calf: मैं तो LLM से कोई उपयोगी काम निकलवाने में ही संघर्ष करता हूँ, इसलिए यह काफ़ी चौंकाने वाला है
  जानना चाहता हूँ कि क्या इस काम में कुछ मिनटों से ज़्यादा लगे, और क्या Claude Code paid version की ज़रूरत पड़ी
evdubs: मैंने यह परखा कि क्या कोई LLM service provider legal documents को hallucination के बिना एक consistent format में rewrite करके missing parts पहचान सकता है, और वह कर सकता था
फिर मैंने देखा कि क्या local LLM से भी यह संभव है, और Gemma-4 ने 8GB video card और 128k बड़े context के साथ यह अच्छी तरह संभाल लिया; उसी model ने OCR और translation भी काफ़ी अच्छा किया
तब मुझे एहसास हुआ कि LLM उन कामों के लिए बेहतरीन है जहाँ मुझे पहले से पता है कि मुझे क्या चाहिए, कैसे करना है, उस काम से मिलने वाली skill बहुत valuable नहीं है, और अगर मैं खुद करूँ तो शायद बस औसत ढंग से करूँ
अब मैं इसे इस नज़रिए से देखता हूँ: “क्या मैं वह काम LLM को दे सकता हूँ जिसकी मुझे वैसे भी बहुत परवाह नहीं होती?”
- SoftTalker: LLM से मुझे सबसे अच्छे नतीजे उन tasks में मिले हैं जहाँ लक्ष्य reading, reformatting, translation और summarization होता है
  ऐसे काम इंसानों की तुलना में यह बहुत तेज़ करता है, और कम से कम अभी के लिए, boredom से भी कम प्रभावित होता है
- gscott: मेरा बेटा bank के साथ मुक़दमे में है; bank ने fraudulent claim को handle करने के बाद chargeback reject किया और उल्टा पैसे माँगते हुए उसी पर मुक़दमा कर दिया
  मेरा बेटा Claude और Gemini की मदद से original lawsuit का जवाब दे रहा है, और अब counterclaim भी 100% AI से तैयार कर रहा है
  वह कई AIs में डालकर उनसे एक-दूसरे की समीक्षा करवाता है और और ideas निकलवाता है; ChatGPT से Grok, फिर Claude तक गया, और अभी Gemini सबसे मज़बूत लग रहा है
- jasondigitized: यह उन कामों में आता है जिन्हें आप करना जानते तो हैं, लेकिन उनके लिए आपके पास समय और ऊर्जा नहीं होती
  यानी बस “Claude ले आओ” वाला मामला
kstrauser: काम पर मेरे पास बड़ा token budget है, और vulnerability testing के दौरान एक सहकर्मी ने एक मशहूर project में दिखने में डरावना remote exploit ढूँढा और मुझसे second opinion मांगी।
मैंने project को local पर चलाकर POC execute किया, लेकिन कुछ नहीं हुआ; तब पता चला कि इसके लिए default security protections को कम करने वाली setting चाहिए।
इसलिए मैंने AI से कहा कि POC को इस तरह ठीक करे कि वह default settings पर भी काम करे, और कुछ ही मिनटों बाद उसने उसे weaponized version में patch कर दिया; मैंने अभी-अभी download करके खुद compile किया हुआ local instance default settings पर चलाया ही था कि वह तुरंत crash हो गया।
console में blink करता cursor देखते हुए मुझे ऐसा ठंडा पसीना आया जैसे हाथ में nuclear information bomb हो, और मैं पूरी रात करवटें बदलता रहा, मुश्किल से करीब 30 मिनट सो पाया।
लेकिन इसके बदले हमारी team के लिए एक साफ ethical direction बन गई: चूंकि हम यह कर सकते हैं, इसलिए हमें यह काम करना चाहिए और नतीजे संबंधित authors के साथ साझा करने चाहिए।
मैं ऐसी दुनिया में रहना चाहता हूँ जहाँ बुरे लोगों के ढूँढने से पहले अच्छे लोग समस्याएँ ठीक करें, इसलिए अब मैंने वही दुनिया बनाने का काम करने का फैसला किया है।
- lobf: यहाँ POC का क्या मतलब है, यह जानना चाहता हूँ।
  ऊपर ऐसा कोई शब्द-समूह नहीं दिख रहा जो इसका acronym हो।
ddxv: LLM-generated code इस्तेमाल करते समय ज़्यादातर एहसास “ओह, बढ़िया है!” वाला होता है, लेकिन कुछ हफ्तों बाद जब model ने जिसे tests pass बताया था उस “बढ़िया” code में कोई subtle bug निकलता है, और मुझे एहसास होता है कि मैंने उसे ध्यान से पढ़ा ही नहीं था, वही पल “अरे?” वाला होता है।
सबसे बड़ा जोखिम यह है कि हम आलसी हो जाएँ, कई files और बहुत सारे changes एक साथ इसे सौंप दें, और बिना पूरी तरह समझे कि इसने क्या किया, YOLO mode में आगे बढ़ जाएँ।
frontend में यह अक्सर चल जाता है, लेकिन data manipulation work अगर समझे बिना किया गया हो तो बहुत संभव है कि वह वैसा न हो जैसा आप चाहते थे, और फिर कुछ हफ्तों बाद लौटकर यह खोजना पड़ता है कि बदला क्या था।
यह LLM से पहले की उस ज़िंदगी जैसा है जब हम StackOverflow से copy-paste करते थे, लेकिन अब copy-paste की रफ्तार कहीं तेज़ है और यह boilerplate को अच्छी तरह संभाल लेता है, इसलिए edge cases पर ध्यान दे सकते हैं।
UncleOxidant: हाल ही में मैंने Claude के साथ demo के लिए FPGA पर चलने वाला spiking neural network MNIST classifier बनाया।
Claude ने concept से लेकर PyTorch, training, Verilog implementation और FPGA synthesis तक सब आगे बढ़ाया, और PC पर mouse से digit draw करके classify button दबाने वाला app भी बनवाया।
मुझे USB से SPI के जरिए FPGA को data भेजना था, लेकिन SPI adapter अभी shipping में था, इसलिए मैंने उससे कहा कि Verilator simulator में चलने वाले Verilog code से virtual SPI के जरिए communicate करवाए, और मैं lunch खाने चला गया।
लौटकर आया तो digit drawing app screen पर खुला था; मैंने ‘2’ बनाया, उसने उसे 2 classify किया, और दूसरी window में Verilator simulator data transfer दिखा रहा था।
मेरे रोंगटे खड़े हो गए।
HlessClaudesman: एक कैफ़े में podcast सुनते समय मैंने सुना कि कोई SF writer साल में 40 से ज़्यादा किताबें लिखता है, और मैंने सोचा कि या तो ghostwriting team होगी, या बहुत ज़्यादा cocaine, या फिर AI।
शुरुआती ChatGPT दौर में मैंने app download किया और उससे novel writing के हर चरण—outline, character summary, plot summary, draft chapter, finished chapter—करवाए; और जब तक मैं दूसरी coffee लेने के बारे में सोचता, pre-edit manuscript तैयार थी।
वह भयानक novel थी, लेकिन उसमें ऐसे चमकते हुए हिस्से थे जिन्हें निकाला और निखारा जा सकता था, और इसने यह hypothesis साबित कर दी कि AI large-scale fiction mass production कर सकता है।
अगर ढेर सारी cocaine भी हो, तो शायद AI के साथ हफ्ते में 40 किताबें भी निकाली जा सकती हैं।
mindcrime: कोई एक खास पल याद नहीं है, लेकिन ChatGPT के साथ पहली बार interact करते ही मैं काफ़ी प्रभावित हुआ था।
मैं इसे AGI कहने के लिए बिल्कुल तैयार नहीं था, लेकिन यह कुछ नया था, और यह बात सहज रूप से साफ थी कि “आज का यह AI आगे चलकर इसका सबसे खराब रूप होगा,” और बदलाव की रफ्तार का अनुमान लगाना मुश्किल है।
जितना ज़्यादा मैं इन्हें इस्तेमाल करता हूँ, उतना ही 100% यकीन होता जाता है कि किसी अर्थ में इन्हें intelligent कहना जायज़ है।
यह अभी भी AGI या human-level intelligence नहीं है, लेकिन Demis Hassabis के “jagged intelligence” की तरह है—कुछ क्षेत्रों में बहुत intelligent, और दूसरे क्षेत्रों में उससे कहीं कम।
मुझे लगता है कि intelligence ऐसे रूप में भी हो सकती है जो human intelligence की तरह काम न करे, इसलिए “यह असली intelligence नहीं है” जैसी दलीलों का मेरे लिए लगभग कोई वजन नहीं है।
इसी पर “The Marquee Sign Says 'Artificial' Intelligence” नाम का एक blog draft मैं लंबे समय से रोके हुए हूँ, लेकिन उसे AI से लिखवाने का इरादा नहीं है।
research, outline और brainstorming के लिए मैं AI इस्तेमाल करता हूँ, लेकिन जो लेख मेरे नाम से जाता है, उसमें मेरी real voice होनी चाहिए—यह सीमा मैं बनाए रखता हूँ।
ben_w: ऐसे कई पल रहे हैं।
पहला InstructGPT demo चौंकाने वाला था, क्योंकि मुझे याद था कि पहले natural language processing का state of the art कितना खराब था, और GPT-3.x की continuation quality से command following तक की छलांग की मैंने उम्मीद नहीं की थी।
2019 का This Person Does Not Exist, 2016 का style transfer और उससे मिलती-जुलती तकनीकें(https://github.com/awentzonline/image-analogies) और वह चीज़ जिसे आज हम deepfake कहेंगे(https://www.youtube.com/watch?v=_S1lyQbbJM4), और 2015 का Tesla का OTA autonomous driving update(https://www.popsci.com/tesla-cars-become-autonomous-overnigh...) भी ऐसे ही थे।
2013 में word2vec का “man” - “woman” ~= “king” - “queen” भी, natural language processing के पुराने स्तर को जानते हुए, “अरे?” वाला पल था; और जब automated propaganda या Polari जैसी slang को समझकर surveillance की संभावना के बारे में सोचें, तो और भी ज़्यादा।
2010 का Word Lens demo video(https://www.youtube.com/watch?v=h2OfQdYrHRs) भी याद है।
alexfoo: किसी ने Brother DCP-L3550CDW प्रिंटर का firmware update करने के बाद, पुराने Prometheus exporter द्वारा इस्तेमाल किया जाने वाला CSV page गायब हो गया और सिर्फ HTML page बचा जिसमें जानकारी कई div के भीतर दबी हुई थी
मैंने खुद HTML parse करके exporter लिखने की सोची, फिर Claude को आज़माया और sandbox VM में प्रिंटर status page की एक static HTML file और सिर्फ fmt.Printf("OK\n") वाला एक minimal Go file डाल दिया
directory का नाम brother-exporter था, और मैंने न कोई और निर्देश दिया, न क्या करना है बताया, न language बताई, फिर भी /init भर से Claude ने यह निष्कर्ष निकाला कि उसे Go Prometheus exporter लिखना है
उसने default 192.168.1.1 प्रिंटर से HTML fetch करके parse करने और Prometheus द्वारा scrape किए जा सकने वाले metrics देने वाला code 10 मिनट में बिना किसी कमी के बना दिया
अगर मैं खुद करता तो कई घंटे लगते, लेकिन शुरुआत में इतनी कम जानकारी से उसने इतना ज़्यादा और इतना सही अनुमान लगा लिया, यही सबसे बड़ा झटका था
tern: शुरुआत में Opus 3.x ने Obsidian MCP के साथ मेरे लिए एक productivity system बनाया, फिर मुझे “समस्या का mathematical model बनाओ और उससे solution derive करो” जैसे prompts मिले
असली “अरे?” वाला पल तब आया जब उसने real-time DSP के लिए नए ideas से भरा compiler/runtime लंबे समय तक spec किया और वह सच में काम भी करने लगा
क्रम लगभग ऐसा था: मुझे खुद को समझने में मदद करना → अच्छे ideas को जोड़ने में मदद करना → सही input मिले तो नए ideas पैदा करना → मेरी मशीन पर उपयोगी tools बनाना → iterative passes के ज़रिए अच्छे ideas को और बेहतर ideas में synthesize करना → मेरी सामान्य क्षमता से बहुत बड़े systems बनाना
अभी frontier यह है कि बड़े codebase को iterative passes से बेहतर systems में synthesize किया जाए, और कुंजी यह ट्रैक करना है कि process converge और compound कर रही है या बस वहीं घूम रही है या diverge कर रही है
- mayank: यही flow मुझे भी बहुत गहराई से relatable लगा
  मार्च 2024 में, जब मैं natural language processing की एक कठिन research problem की जाँच और implementation करने की कोशिश कर रहा था, तब लगा कि सिर्फ prompt और completions API से ही काफ़ी अच्छा approximation किया जा सकता है
  2025 के मध्य तक Llama 3 ने onboarding के दौरान एक काफ़ी बड़े codebase का analysis किया और ऐसे diagram-level results synthesize किए जिन्हें मैं खुद decisive tool मानता
  दिसंबर 2025 में Opus 4.5 ने multi-class modules और tests लगभग पूरी तरह syntactically correct बनाए, और मुझे समझ आया कि errors मेरी prompt underspecification की वजह से थे
  अब मैं लगभग हाथ से code नहीं लिखता, क्योंकि output काफ़ी अच्छा होता है और tests, docs, build scripts जैसी सहायक चीज़ें मुफ़्त में साथ आ जाती हैं
notthetup: backup के दौरान files को move करते समय कुछ अनोखी concert audio recordings corrupt हो गई थीं
डेटा जैसे मौजूद था, लेकिन कोई software उन्हें चला नहीं पा रहा था, और 5 साल तक पड़े रहने के बाद मैंने AI tools से recovery की कोशिश की
Copilot के साथ 20 मिनट और बहुत सारे hex dump खंगालने के बाद पहले एक आधा-अधूरा solution मिला जिसमें file के सिर्फ शुरुआती कुछ seconds चल रहे थे, लेकिन अंततः सभी files recover करने में सफलता मिल गई
nwhitehead: मेरे spouse की कहानी—आज उसने Claude की मदद से एक Steam game में progress रोक देने वाले bug का diagnosis किया
18 मिनट लगे, लेकिन उसने Godot package unpack किया, bug ढूँढा, fix सुझाया, और in-game workaround भी बता दिया
मुझे कुछ नहीं करना पड़ा; Claude ने strings से .pck file structure समझा और फिर एक specific chunk unpack करने के लिए Godot-specific magic वाला Python code लिख दिया
simonw: मेरे लिए वह पल लगभग मार्च 2023 में ChatGPT Code Interpreter को देखने पर आया
मैंने San Francisco police incidents वाला CSV upload किया, उसने उसे Pandas से पढ़ा, charts दिखाए, फिर data को SQLite database file में export करके download भी करने दिया
data journalists के लिए software बनाने वाले व्यक्ति के तौर पर, uploaded file वाले folder में Python चला पाने वाला यह side effect ही ऐसा लगा जैसे यह मेरे software से चाही जाने वाली लगभग हर चीज़ कर सकता है
पीछे मुड़कर देखें तो वही coding agent से मेरा पहला सामना था, बस उस समय इस category का नाम भी नहीं था
mlmonkey: मेरा consultant दोस्त Netsuite और Oracle के niche में था; accounting background के साथ वह clients के instances configure करके बहुत पैसे कमाता था और खूब golf भी खेलता था
ChatGPT के mainstream होते ही जब मैं AI की संभावनाओं को लेकर उत्साहित होकर उससे बात कर रहा था, तो उसने कहा, “यह मेरा काम नहीं कर पाएगा,” और बात को ठंडा करने की कोशिश की, फिर घर जाकर laptop पर test किया
उसने वैसी ही Netsuite configuration specs डलवाई जैसी उसे clients से मिलती थीं, साथ में तरह-तरह के options और configurations, और setup commands माँगे; ChatGPT ने चलाने वाले commands और set किए जाने वाले options की पूरी सूची दे दी
मेरा दोस्त बोला, “ये तो वही exact commands हैं जो मैं चलाता हूँ,” और उसका उत्साह बैठ गया, लेकिन बाद में उसने जान-पहचान वाले owners की कुछ private companies को stable clients बना लिया, जिससे उसकी golf hobby चलती रहे उतनी कमाई हो जाती है
- reactordev: कई बार आपके द्वारा दी जाने वाली value से ज़्यादा service खुद अहम होती है
  clients भले खुद ConsultBot 2.0 चला सकें, लेकिन वे यह जानते हैं कि काम हमेशा की तरह भरोसेमंद हाथों में है
djfergus: कई साल से दराज़ में पड़ा 1st-gen Amazon Firestick latest software तक update हो चुका था और उसके लिए कोई public root exploit नहीं था
मैंने एक दिन तक Claude और Codex के बीच उसे research कराई; kernel source download कराया और exploit कोशिशों के बाद अंत में “FBUF/VCHIQ kernel zero-write primitive to patch live kernel memory” के ज़रिए root access मिल गया
मैं root को persist कर सका, Amazon apps हटा सका, firmware downgrade कर सका, और यह सोचकर उत्साहित हुआ कि आगे चलकर ज़्यादा पुराने और नए hardware को reuse करना संभव होगा
- aizk: क्या इसे GitHub पर share कर सकते हो?
PopePompus: मैं iPhone App Store से पहले के दौर के Nokia N900 के लिए लिखे अपने पुराने astronomy app को Claude Code की मदद से Android app के रूप में फिर से बना रहा था
मूल app कई display pages बनाता था, जैसे planets की positions, और मैं बिना original code या उसके अस्तित्व का ज़िक्र किए सिर्फ screen descriptions के आधार पर हर page को recreate करवा रहा था
कई pages recreate करने के बाद Claude ने एक extra page जोड़ दिया जिसे मैंने माँगा ही नहीं था, और वह वही page था जो मूल Nokia app में था लेकिन जिसे Android app में जोड़ने के लिए मैंने अभी तक नहीं कहा था
Nokia app का code GitHub पर अब भी मौजूद था, और ऐसा लगा कि Claude ने किसी तरह मेरे दिए हुए काम को मेरे GitHub repository में पड़े Nokia code से जोड़ लिया; उसने गायब page को बिल्कुल सही implement कर दिया, और मैं सचमुच दंग रह गया था
vitorbaptistaa: मैं 10 लोगों वाली एक छोटी NGO का CTO था और उस समय केवल एक junior developer था, जबकि हम consultant द्वारा बनाए गए दो apps को support कर रहे थे
हफ्ते में 50 users वाली site के लिए NextJS, React, और 4 microservices जुड़ी हुई एक बुरी तरह बिखरी architecture थी
मैंने पुराने codebase वाला devcontainer और एक खाली repository तैयार की, Claude से इसे पुराने server-side rendering Django app के रूप में फिर से लिखने को कहा और सो गया; सुबह तक 80% काम हो चुका था
कुछ और दिनों तक prompts और review के बाद हमने feature parity हासिल कर ली, और दूसरे app के साथ भी यही तरीका अपनाया
अब दोनों deploy हो चुके हैं, server cost और complexity कम हो गई है, वे कई गुना तेज़ हैं, और AI agent के बिना यह वह काम था जो आम तौर पर technical debt की तरह कभी हो ही नहीं पाता; छोटी संस्थाओं के लिए AI हैरान कर देने वाला उपयोगी है
dang: मेरे लिए बड़ा क्षण वह था जब मैंने इसे कुछ ही सेकंड में log files analyze करते देखा
अगर मैं खुद करता तो इसमें कई घंटे, सच कहें तो कई दिन लगते, और इसी वजह से यह शायद वह काम था जिसे मैं शुरू ही नहीं करता
इसने कई सालों से टले हुए optimization में भी मदद की, क्योंकि उसने उस entry barrier को पार करने में सहायता की जिसे सीखने का मेरे पास समय नहीं था, और खासकर race condition जैसे concurrency bugs को track करने में भी मदद मिली
इसने वह जानकारी भी ढूँढ निकाली जो मुझे Google search से नहीं मिली थी(https://news.ycombinator.com/item?id=42653136); समान बात यह है कि ये ऐसे काम थे जो असंभव होने की वजह से नहीं, बल्कि बहुत ज़्यादा समय और मेहनत मांगने की वजह से कभी होते ही नहीं थे, और इसने उन्हें वास्तव में संभव बना दिया
- bentcorner: आज मैंने agent से दो logs compare करके वह बहुत छोटा अंतर ढूँढने को कहा जो समस्या की जड़ था
  जैसे ही मैंने problematic ADO extension की ओर इशारा किया, उसने VSIX डाउनलोड किया, .NET binaries को decompile करके जाँच की, और उस जानकारी के आधार पर एक workaround सुझाया जिस पर मुझे बहुत शक था, लेकिन वह सच में काम कर गया
  तकनीकी रूप से मैं भी यह कर सकता था, लेकिन reward स्पष्ट नहीं था और इसमें इतना समय लगता कि शायद मैं करता ही नहीं
- djmips: 20 साल पहले बनाए गए मेरे personal project game में एक खराब bug था, और उसी वजह से मैं उसका final release नहीं कर पाया था; मैं debugging करने वापस भी नहीं गया
  कल वह GitHub के सबसे ऊपर दिखा, तो मैंने समस्या समझाई और Claude ने तुरंत bug ढूँढ लिया; कुछ rounds की बातचीत के बाद उसने एक संतोषजनक fix भी दे दिया
  अब लगता है कि मैं final release कर पाऊँगा, और इतने पुराने अधूरे काम को खत्म करके अच्छा लग रहा है
hgoel: हाल ही में मैंने drawing, खासकर anatomy सीखने के लिए Claude से मदद माँगी
मैंने sketches upload किए और feedback माँगा; उम्मीद के विपरीत यह बहुत उपयोगी निकला, और जिन हिस्सों को मैं अजीब महसूस कर रहा था लेकिन कोई और कभी बताता नहीं था, उन्हें इसने ठीक-ठीक समझाया
जिज्ञासा में मैंने कहा कि sketch पर समस्याओं को label करके दिखाओ, तो उसने coordinates निर्दिष्ट करने वाली Python script लिखकर खुद labels लगा दिए
मेरे मन में अब भी यह धारणा थी कि vLLM visual tasks में अभी खास नहीं है, इसलिए वास्तव में उपयोगी drawing advice मिलना काफ़ी चौंकाने वाला था
- loneboat: जानना चाहूँगा कि feedback किस तरह का था
  क्या वह anatomical feedback था, जैसे “बाँह वहाँ जुड़ती ही नहीं”, या फिर shading tips जैसे drawing technique वाले सुझाव?
takee: मैं अपने 10 साल के बच्चे के साथ स्कूल science fair में दिखाने के लिए electromagnetism का एक experiment कर रहा था, तभी एक ऐसी समस्या आ गई जिसे मैं खुद debug नहीं कर पा रहा था
मैंने Gemini live video call चालू की और उससे root cause analysis में मदद माँगी; उसने संभावित समस्याओं को साफ़-साफ़ समझाया, और आखिरकार हम setup को उम्मीद के मुताबिक चलाने में सफल रहे
समस्या यह थी कि screw पर लिपटी wire के battery connection वाले हिस्से की insulation ठीक से नहीं उतारी गई थी, और Gemini ने वह detail भी पकड़ ली जो मेरी नंगी आँख से दिख नहीं रही थी
बच्चा और उसके दो दोस्त न सिर्फ experiment से, बल्कि AI के साथ real-time voice·video conversation को लगभग जादू जैसा मानकर उससे भी दंग रह गए
- foobarbecue: बढ़िया है, लेकिन मैं दाँव लगाऊँगा कि उसने इसे सच में देखा नहीं, बल्कि ऐसा अनुमान लगाया होगा
lodovic: मैं PR review thread का screenshot paste करके बस इतना कहता था, “review comments आए हैं, इन्हें ठीक कर दो,” और जब उसने सब कुछ पूरी तरह हल कर दिया, छोटे-छोटे commits बनाए और upstream पर push भी कर दिया, तब मैं सच में हिल गया
उसके बाद मैं यह देखने के लिए कि वह मेरे इरादे को कहाँ तक समझता है, उसे लगातार असंभव tasks, बहुत बड़े projects और complex architectures देता रहा
हाल ही में उसने एक हफ्ते तक हर दिन कई घंटे लगाकर scratch से MPI, TCP/IP, GUI सहित एक पूरी OS लिख दी, और उस पर Doom भी चलता है
नौकरी के रूप में coding खत्म हो चुकी है, लेकिन जब इसे professional mindset के साथ किया जाता है तो परिणामों का अंतर इतना बड़ा होता है कि मुझे अब भी लगता है कि software engineering discipline की बहुत बड़ी value है
jmkni: यह coding नहीं, बल्कि logs पढ़ना था
मैं एक nightmare जैसे bug को ढूँढ रहा था जो सिर्फ production में होता था, और Claude Code Google Cloud से connect होकर real time में logs पढ़ सकता था
जैसे ही मैंने UI में bug reproduce किया, उसने तुरंत logs में समस्या पकड़ ली, और पूरे codebase का context होने की वजह से उसने ठीक वही code line भी बता दी जो root cause थी
वह निश्चित रूप से “अरे?” वाला क्षण था
marcus_holmes: मैंने मुरझाते हुए पौधे की फोटो खींचकर Claude को दिखाई, और उसने बताया कि उसे फिर से स्वस्थ कैसे करना है और cuttings से उसे कैसे उगाना है
coding वाले उदाहरण समझ में आते हैं क्योंकि वहाँ computer, computer के बारे में बात कर रहा होता है, लेकिन computer को पौधे की फोटो दिखाओ और वह पौधे को पहचान ले, diagnose कर ले, और क्या करना है यह भी बता दे — यह तो SF जैसा लगा, और सच में चौंकाने वाला था
- aizk: तुम्हें यह पसंद आ सकता है — Claude ने autonomously tomatoes उगाए: https://autoncorp.com/biodome/
bonoboTP: सबसे बड़ा पल 2022 में ChatGPT के लॉन्च के तुरंत बाद था, खासकर जब वह Linux terminal roleplay करता था और "डेटासेंटर में आग लग गई" जैसा दृश्य बताने के बाद nvidia-smi को "चलाने" पर GPU तापमान ऊंचा दिखाता था
होम डायरेक्टरी, या मशहूर लोगों की होम डायरेक्टरी, को "एक्सप्लोर" भी किया जा सकता था, और अगर वह terminal को इतनी अच्छी तरह समझता है तो tool use और agents बस आने ही वाले हैं—मुझे इस बात का पक्का यक़ीन हो गया था
Opus 4.5 ने महसूस कराया कि वह चीज़ आखिरकार आ गई है, लेकिन 2022 में मुझे सच में लगा था कि यह 2023~2024 में और जल्दी आ जाएगी
इमेज वाली तरफ, nano banana को देखकर लगा कि AI images सच में काम कर गई हैं, और हाथ-पैर या "astronaut घोड़े पर सवारी नहीं कर सकता" जैसी अस्थायी समस्याएँ खत्म हो जाएँगी, यह साफ़ हो गया
फीचर-लेंथ फ़िल्म बनाना भी अब उस दायरे में आ गया है जहाँ agents script, character और shots को समन्वित करते हुए जनरेट करेंगे; कहानी देखने लायक है या नहीं, उससे अलग, "फ़िल्म" तो बन जाएगी
- cineticdaffodil: ऐसा लगता है कि 8 अरब लोगों के बीच छिपे Steve Spielberg, बिना connections और बिना Hollywood name value के, सिर्फ safe choices करने वाली investment screening में छँटे बिना, जब उनका दिन आएगा तो इतनी अच्छी रचनाएँ बना पाएँगे कि वे उम्र भर खुश cinephile बनकर जी सकें
- zamadatix: यह बात कि ChatGPT conversational text generation और terminal की नकल—दोनों कर सकता है, पूरी तरह चौंकाने वाली थी, और तब मैंने बिल्कुल नहीं सोचा था कि वह approach इस तरह scale करेगी
  बाद में और भी प्रभावशाली tasks बहुत आए, लेकिन उस समय जैसी शुद्ध विस्मय की भावना फिर किसी ने नहीं दी
jb_briant: मैं एक 3D game बना रहा हूँ, और मुझे सपाट दुनिया पसंद नहीं थी इसलिए मैं planet इस्तेमाल करना चाहता था
सतह gameplay के लिहाज़ से finite है क्योंकि वह expand नहीं होती, लेकिन साथ ही world boundary से टकराना नहीं पड़ता, इसलिए वह infinite जैसी महसूस होती है—यह बहुत elegant था
player के लिए Cartesian coordinates उतने उपयुक्त नहीं थे, इसलिए latitude/longitude/altitude grid system चाहिए था, और चाहूँ तो StackOverflow पर कई दिन खंगालकर त्रुटियों से भरी implementation debug कर सकता था
2024 के ChatGPT web version ने लगभग एक ही बार में helper functions बना दिए, और यह इस वजह से और भी प्रभावशाली था कि इसमें सचमुच बहुत pitfalls थे
- linsomniac: मैं Claude के साथ retro games बनाने का प्रयोग कर रहा हूँ
  browser में चलने वाला Rally-X inspired retro arcade game: https://linsomniac.github.io/rally-xy/
  मैंने nsnipes शैली का networked multiplayer maze shooter भी बनाया है, और यह browser-based है लेकिन network multiplayer के लिए server चाहिए: https://github.com/linsomniac/isnipes
vishvananda: वह इस साल की शुरुआत में था, जब मैंने रुके हुए पुराने projects फिर से निकाले और agents को सौंप दिए
कुछ ही दिनों में मैंने Oracle team में रहते हुए बनाए गए AlphaZero implementation के clone (https://medium.com/oracledevs/lessons-from-implementing-alph...) बनवाए, अपने hobby NES emulator को JavaScript से Rust में port कराया (https://github.com/vishvananda/popeye), और C++ Grandmasters Challenge के सारे lessons implement कराते-कराते आखिर एक पूरा C++ compiler तक पहुँच गया (https://medium.com/@vishvananda/i-spent-2-billion-tokens-wri...)
खासकर NES emulator porting में 30 मिनट भी नहीं लगे, और वह पहली कोशिश में चल गया
पहले जिन चीज़ों को मैंने खुद मेहनत से बनाया था, उन्हें दोबारा बनवाने का अनुभव ही वह स्विच था जिसने असर किया; उनकी कठिनाई मुझे पता थी, इसलिए यह दूसरे projects से कहीं ज़्यादा गहराई से लगा
a_bonobo: अपनी पिछली नौकरी में मैंने unverified animal sighting records को व्यवस्थित किया था, और अलग से species distribution maps पर आधारित animal occurrence probability database भी था
मैं statistician नहीं हूँ, लेकिन अगर sightings, उस क्षेत्र में species की base occurrence probability, और sighting noise के बारे में कुछ assumptions दिए जाएँ, तो वास्तव में उस species के शामिल होने की probability निकालना Bayes' theorem के लिए बिल्कुल सही problem जैसा लगा
Claude ने तीन सवाल पूछने के बाद map को query करके एक खूबसूरत Python implementation लिख दी, जो adjusted probability table निकाल देती थी
तब पहली बार बहुत ताकतवर महसूस हुआ कि अब सही व्यक्ति मिलने या पहले सही ज्ञान सीखने का इंतज़ार किए बिना मैं ऐसे काम "अकेले" कर सकता हूँ
dannyobrien: ChatGPT से पहले मुझे OpenAI API का शुरुआती access मिला था, और यह करीब 2019 की बात है जब काम पर हम charity event के लिए livestream JackBox game तैयार कर रहे थे
बहुत पहले मैं मूल You Don't Know Jack game के UK version का writer रहा था, जहाँ हम किसी topic पर ढेरों मज़ेदार one-liners लिखते थे और उनमें से सिर्फ कुछ को recording में इस्तेमाल करते थे
प्रयोग के तौर पर मैंने OpenAI API में वैसी setup lines डालीं, और 90% चीज़ें unfunny या incoherent थीं, लेकिन हर 10 में 1 बुरी नहीं थी, बल्कि काफ़ी ठीक थी
शायद दूसरों को यह प्रभावशाली न लगा हो, लेकिन मैंने वह writers' room वाला माहौल देखा था जहाँ सब लोग घंटों यही काम करते थे, इसलिए मुझे समझ आया कि यह creative assistance tool के रूप में एकदम सही complement हो सकता है
यह JackBox player के रूप में भी काफ़ी अच्छा था
- darksim905: JackBox के बारे में ज़्यादा नहीं जानता, लेकिन मूल You Don't Know Jack games की यादें अब भी बहुत अच्छी लगती हैं
xtracto: शायद इसके लिए आलोचना हो, लेकिन LLM की मदद से मैंने एक छोटा प्रोग्राम लिखा जो ब्राउज़र स्क्रीन पर चल रहे Xbox Live ऑनलाइन FPS गेम का वीडियो कैप्चर करता है, एक छोटे trained neural network से इंसानी आकृतियों को पहचानता है, और उन्हें दूसरी स्क्रीन पर दिखाता है
PVP मैच में दुश्मनों के ऊपर हरा overlay डालकर उन्हें बेहतर दिखाने का तरीका है, और छोटे YOLO neural network की training/fine-tuning समेत यह लगभग 100 लाइनों के code में हो गया
- darksim905: समझ नहीं आता कि इसकी आलोचना क्यों होनी चाहिए
  जो लोग नहीं जानते, उन्हें यह cheating जैसा लग सकता है, लेकिन मूल रूप से यह computer vision का अभ्यास है
  गेम modding क्षेत्र के DMA-टाइप tools भी subscription services के ज़रिए पैसा कमाते हैं, इसलिए वे प्रभावशाली होने के साथ अजीब तरह से गोपनीय भी हैं, और यह भी दिलचस्प है कि ऐसे tools और mux hardware कितनी अच्छी तरह काम करते हैं
  अगर इसे onboard memory और तेज interconnect वाले DGA जैसे hardware के साथ जोड़ दिया जाए, तो reverse engineering, malware analysis, और forensics के क्षेत्र जानने वालों के लिए यह बहुत दिलचस्प समय होगा
- jerryoftheyear: मुझे जिज्ञासा है कि यह तरीका कितना input lag जोड़ता है
tejohnso: ऐसा कोई पल नहीं आया जब हल्की घबराहट हुई हो, लेकिन पिछले 1 साल में programming के प्रति मेरा तरीका बदल गया है
पहले जब मैं कोई project शुरू करता था, तो structure, बड़े हिस्सों की आपसी interaction, detail implementation, alternatives और उनके परिणामों पर अकेले सोचता था
अब अकेले सोचने के बजाय मैं LLM के साथ बातचीत करते हुए आगे बढ़ता हूँ, कई स्रोतों से जानकारी जल्दी इकट्ठा करता हूँ, canonical materials के links माँगता हूँ, और उन alternatives के trade-offs पूछता हूँ जिन पर शायद मैंने विचार नहीं किया होता, ताकि ज़्यादा detailed analysis तक पहुँच सकूँ
development के दौरान भी मैं एक नए agent partner को लगातार context में रखकर discussion, suggestions, और problem solving के लिए इस्तेमाल करता हूँ
मैं उस पर पूरी तरह भरोसा नहीं कर सकता, लेकिन मेरे उद्देश्यों के लिए वह काफ़ी भरोसेमंद workflow tool बन गया है, और एक दिलचस्प खिलौने से पूरी तरह integrated tool बनने की इसकी रफ़्तार बहुत तेज़ रही है
tobyhinloopen: क्लाइंट के non-technical staff ने vibe coding से एक app बना लिया, और मुझसे उसे review करके deploy करने को कहा गया
नतीजा ठीक था, और कोई गंभीर समस्या भी नहीं थी
उसी समय जब मैंने client feedback के पूरे PDFs, screenshots वगैरह Claude में डाले, तो उसने लगभग 7 घंटे तक लगभग बिना निगरानी के reproduction और fixes करते हुए कई MR बना दिए
ज़्यादातर fixes अच्छे थे, और कुछ तकनीकी रूप से सही थे लेकिन क्लाइंट वही नहीं चाहता था, तो मैंने ऐसा कहा और Claude ने उसे ठीक कर दिया
- namanyayg: अब यह आम तौर पर काम करने लायक काफ़ी अच्छा हो गया है
  इसलिए मैंने उसी विचार के इर्द-गिर्द एक startup बना लिया
rerdavies: मैं एक Spice compiler पर काम कर रहा था जो classical guitar pedal schematics को real-time executable code में बदलता है
मैंने Claude को The Spice Manual 2nd ed. के page numbers और equation numbers बताए और implementation माँगा, हालाँकि सच कहूँ तो मुझे सफलता की उम्मीद नहीं थी
लेकिन उसने न सिर्फ उन equations को implement किया बल्कि 30 लाइनों नीचे मौजूद function की Lagrangian calculation भी लागू कर दी, जिसके लिए एक गैर-तुच्छ function की symbolic partial differentiation करनी पड़ी और यह समझना पड़ा कि result matrix में कौन-सा variable क्या है
मूल पाठ में सिर्फ “Lagrangian of” लिखा था और partial differential equations दी ही नहीं गई थीं, फिर भी वह सफल रहा, और उस Lagrangian equation के source page और equation number की टिप्पणियाँ भी जोड़ दीं
- djmips: यह काफ़ी मज़ेदार लग रहा है
  Claude से बस करवा लेना आसान होगा, लेकिन जानना चाहता हूँ कि क्या इसे साझा करने की कोई योजना है