AI का उपयोग करें या नहीं

(antropia.studio)

5 पॉइंट द्वारा GN⁺ 2025-10-01 | 2 टिप्पणियां | WhatsApp पर शेयर करें

2 हफ्तों तक सिर्फ़ AI-सहायित डेवलपमेंट वर्कफ़्लो के सहारे एक ऐप बनाने का प्रयोग किया गया, लेकिन नतीजे उम्मीद के मुताबिक संतोषजनक नहीं रहे
Claude Code और Remix-आधारित स्टैक का उपयोग करते हुए इश्यू परिभाषा → AI इम्प्लीमेंटेशन → कोड रिव्यू → डिप्लॉयमेंट प्रक्रिया को बार-बार दोहराया गया
लेकिन कॉन्टेक्स्ट की कमी, दोबारा उपयोग न हो सकने वाला डुप्लिकेट कोड, फ़्लो का टूटना, हैलुसिनेशन, और Pareto नियम की समस्या के कारण निराशा बढ़ती गई
अंततः 2 हफ्तों बाद AI-केंद्रित डेवलपमेंट छोड़कर पुरानी पद्धति पर लौटे, और कोड को व्यवस्थित करने व गुणवत्ता सुधारने में अधिक संतोष मिला
फिलहाल AI का उपयोग केवल सर्च, रबर डकिंग, कोड स्निपेट, टेस्टिंग, भाषा सुधार जैसे सीमित कामों के लिए किया जा रहा है, और बुनियादी तकनीकी बदलाव आने तक इसे इससे आगे बढ़ाने की योजना नहीं है

प्रयोग का अवलोकन

हाल में ध्यान आकर्षित कर रहे LLM(बड़े भाषा मॉडल) के डेवलपमेंट वर्कफ़्लो को सीधे लागू करते हुए 2 हफ्तों का ऐप डेवलपमेंट प्रयोग किया गया
Facebook Ads अकाउंट के जटिल UI अनुभव के आधार पर, केवल Facebook Ads API का उपयोग करने वाले सरल विज्ञापन प्रबंधन टूल adbrew के एक प्रोटोटाइप का विकास शुरू किया गया
यह प्रयोग AI की क्षमता को परखने और वास्तविक समस्याओं के समाधान की उम्मीद के साथ किया गया

अपनाया गया तरीका

AI से जुड़े कई अकाउंट फ़ॉलो करना और वर्कफ़्लो का अध्ययन करना, तथा Remix/React Router v7 को टेक स्टैक के रूप में चुनना
Claude Code की सदस्यता लेने के बाद, प्रॉम्प्ट, DX टूल सेटिंग, इश्यू परिभाषा आदि जैसी शुरुआती सेटअप पर समय लगाया गया
दैनिक रूटीन
- इश्यू परिभाषित करना
- AI से इम्प्लीमेंटेशन का अनुरोध करना
- AI के साथ आवश्यकताओं को समायोजित करना
- जनरेट किए गए कोड की विस्तार से समीक्षा करना
- कोड कमिट/डिप्लॉय करना
- प्रक्रिया को दोहराना
- गाइडलाइन और ऑटोमेटेड चेक फ़ाइलों में समय-समय पर सुधार करना
AI और डेवलपमेंट फ़्लो को एक-दूसरे के अनुरूप लाने की कोशिश लगातार जारी रही

बार-बार सामने आई समस्याएँ

कॉन्टेक्स्ट हमेशा कम पड़ता था
- बहुत सारा कॉन्टेक्स्ट देने पर भी AI आवश्यक फ़ीडबैक नहीं मांगता था
- AI मनमानी धारणाएँ बनाकर काम आगे बढ़ाता था, और नतीजतन गलत इम्प्लीमेंटेशन बार-बार होते थे
कोड की पुन: उपयोगिता और मेंटेनेंस लगभग असंभव
- एब्स्ट्रैक्शन और पुन: उपयोग योग्य कोड बनाने में कमी
- मौजूदा कॉम्पोनेंट्स को बार-बार दोबारा बनाना, जिससे रिव्यू थकान बढ़ी
- गाइडलाइन लागू करने का असर बहुत सीमित रहा
वर्कफ़्लो का टूटना
- AI के काम के दौरान लगातार निगरानी की ज़रूरत पड़ती थी
- हर इश्यू-आधारित यूनिट पर प्रभावी फ़ोकस टाइम निकालना मुश्किल था, जिससे उत्पादकता घटी
हैलुसिनेशन की समस्या
- जटिल Facebook API, अधूरी डॉक्यूमेंटेशन और गलत टाइप किए गए SDK के साथ मिलकर AI का गलत आत्मविश्वास और अधिक भ्रम पैदा करता था
- विभिन्न फ़्रेमवर्क और लाइब्रेरी के बारे में AI बार-बार गलत जानकारी देता रहा
Pareto प्रभाव और गहरा हुआ
- कुल काम का 80% हिस्सा AI तेज़ी से कर सकता था, लेकिन बाकी 20% को अंतिम रूप देने और ठीक करने में 80% मेहनत लगती थी
- एरर हैंडलिंग, फीचर्स के बीच इंटरैक्शन आदि में बड़े दोष और कई बग सामने आए

परिणाम और पुनरावलोकन

2 हफ्तों बाद कोड धीरे-धीरे बिखरता गया और नियंत्रण से बाहर हो गया
डेवलपमेंट प्रक्रिया में आनंद खत्म होना और गुणवत्ता संबंधी समस्याओं के कारण पुराना वर्कफ़्लो फिर अपनाया गया
दोबारा मैन्युअली कोड को व्यवस्थित करते समय AI रिव्यू से छूटे हिस्से मिले, और अंततः बेहतर कोडबेस हासिल हुआ

वर्तमान में AI का उपयोग कैसे हो रहा है

शक्तिशाली सर्च इंजन: जटिल जानकारी खोजने और कॉन्टेक्स्ट-अनुकूल जवाब पाने में प्रभावी, और असफल होने पर पुरानी पद्धति पर जल्दी लौटना संभव
रबर डकिंग (आइडिया ब्रेनस्टॉर्मिंग): विकल्प सुझाने, खोज के दायरे को बढ़ाने और संबंधित कीवर्ड तलाशने में खासतौर पर उपयोगी
कोड स्निपेट असिस्टेंट: बार-बार बनने वाले यूटिलिटी फ़ंक्शंस को ऑटोमेट करके डेवलपमेंट थकान कम करता है
टेस्ट कोड सहायता: टेस्ट से जुड़े नए परिदृश्य खोजने में AI का उपयोग
भाषा से जुड़े काम: कमिट मैसेज, इश्यू, PR आदि टेक्स्ट एडिटिंग के लिए उपयोगी
- हाल में स्थिति उलट गई है: अब AI लिखने के बजाय डेवलपर द्वारा लिखी गई चीज़ की समीक्षा कर रहा है

निष्कर्ष और आगे की दिशा

रोज़मर्रा के कामों में सहायता के लिए AI का उपयोग जारी रहेगा, लेकिन पूरी डेवलपमेंट प्रक्रिया AI को सौंपने को लेकर फिलहाल नज़रिया नकारात्मक है
लोकल LLM को प्राथमिकता देने और डेटा पर नियंत्रण बनाए रखने की कोशिश जारी है
भविष्य में तकनीकी बदलावों पर नज़र रखते हुए, अभी के लिए AI के उपयोग का दायरा सीमित रखने की योजना है

2 टिप्पणियां

shakespeares 2025-10-06

जटिल काम करते समय यह कमी बहुत ज़्यादा महसूस होती है.
मज़ा खत्म हो जाता है + कोड बिखर जाता है..
अक्सर लगता है कि इसे वास्तव में code refactoring + आइडिया के इस्तेमाल के अलावा किसी और चीज़ के लिए इस्तेमाल करना उपयुक्त नहीं है.

GN⁺ 2025-10-01

Hacker News राय

हाल ही में मैंने ChatGPT से एक बहुत साधारण rsync कमांड पूछने की एक घंटे से ज़्यादा कोशिश की, लेकिन वह बार-बार ऐसे कमांड पैरामीटर देता रहा जो मेरे mac के rsync version पर काम ही नहीं करते थे, असफलता का लगभग आधा हिस्सा बेहूदा troubleshooting में निकल गया और बाकी में वह यह कहता रहा कि उसे अपनी गलती “समझ में आ गई”, लेकिन फिर भी गलत version वाला जवाब देता रहा, मैंने उसे निर्देश दिया कि पैरामीटर मेरे पास मौजूद version के हिसाब से verify करे, लेकिन वह साफ़ तौर पर यह कर नहीं पाया, सच तो यह है कि अकेले करता तो 5 मिनट में काम हो जाता, लेकिन मैं बस देखता रहा कि यह दिलचस्प तकनीक मेरा समय बर्बाद करती जा रही है, मैं पेशेवर developer नहीं हूँ, इसलिए सोच रहा हूँ कि क्या developers के बीच भी ऐसा अनुभव आम है, शायद अगर आप ऐसे software version के लिए code करें जो LLM के मुख्य training set से मेल खाते हों तो यह समस्या न आए, और क्या prompt से इससे बचने का कोई तरीका है, यह भी जानना चाहता हूँ, फिलहाल तो मुझे नहीं लगता कि LLM coding के काम में सचमुच समय बचाते हैं, बल्कि उनकी अजीब प्रकृति के कारण ज़्यादा समय बर्बाद होता है
- मैं LLM से कहूँ कि वह मेरे version के हिसाब से पैरामीटर verify करे, तब भी वह ठीक से नहीं करता, इस पर AI experts की राय जानना चाहता हूँ, मेरे साथ भी ऐसा बहुत हुआ है, आखिरकार LLM सच में यह नहीं समझता कि मैं क्या कह रहा हूँ, गणितीय रूप से देखें तो इसकी वजह भी समझ में आती है, लेकिन दूसरी तरफ transformer जैसी तकनीकें या अलग tricks शायद ऐसे कामों में लगाई गई हैं जो alphabet गिनने जैसी शर्मनाक चीज़ों से आगे हों, तो सोचता हूँ कि कहीं मैं कुछ मिस तो नहीं कर रहा
- developers के बीच भी ऐसा अनुभव बहुत आम है, कोई कह सकता है कि “मेरे साथ ऐसा कभी नहीं हुआ”, लेकिन वे बहुत कम अपवाद होंगे, ज़्यादातर लोग इसी तरह शिकायत करते हैं, आपने यह भी पूछा कि क्या prompt से ऐसी समस्याओं से बचा जा सकता है, लेकिन अगर बात training data में ही नहीं है तो उसका कोई खास फ़ायदा नहीं, कई भाषाओं में LLM वाकई बहुत खराब हैं, CLI tools के मामले में, आप LLM को macOS या BSD version बता भी दें तो भी वह अक्सर GNU flags ही देता रहता है, खासकर macOS में हाल में rsync बदला है, इसलिए ऑनलाइन जानकारी भी कम है, संदर्भ लिंक rsync replacement पर पोस्ट, और यह मानना कि LLM coding में समय बचाएँगे, अपने-आप में best case है, उल्टा कई बार लोग LLM के code पर आँख मूँदकर भरोसा करके commit कर देते हैं और bugs या security vulnerabilities पैदा हो जाती हैं, संदर्भ सामग्री ai-coding-slowdown ब्लॉग और arxiv पेपर
- prompt से इससे बचा जा सकता है या नहीं, यह तो पक्का नहीं, लेकिन Claude Code में कमांड सीधे चलाई जा सकती है, यानी LLM से कुछ भी कल्पना करने को कहने के बजाय ! man rsync या ! rsync --help जैसे कमांड का असली output context में जोड़ सकते हैं
- जब किसी खास tool का manual ही देखना है, तो फिर LLM का इस्तेमाल करने की ज़रूरत क्यों है, यही सवाल है
- ChatGPT से एक साधारण rsync कमांड पाने के लिए एक घंटे से ज़्यादा कोशिश करने वाली बात पर, मैं आम तौर पर environment information और error messages अच्छी तरह जोड़कर कई बार कोशिश करता हूँ, और फिर भी न हो तो Claude, Gemini जैसे दूसरे models आज़माता हूँ, अगर तय संख्या तक कोशिश करने पर भी हल न मिले तो मान लेना चाहिए कि LLM से मदद मिलना मुश्किल है, तब manual, forums या पुराने तरीकों से जानकारी ढूँढना कहीं तेज़ होता है, आम तौर पर 10-20 मिनट कोशिश करके आगे बढ़ जाना एक व्यावहारिक सीमा है, कुछ समस्याएँ ऐसी होती हैं जिन्हें LLM कितना भी समय ले, हल नहीं कर पाता और बस गोल-गोल घूमता रहता है
मेरे साथ भी ऐसे अनुभव बहुत हुए हैं, AI सचमुच तब मददगार होता है जब मैं उससे वह काम करवाता हूँ जो मुझे पहले से करना आता है, अगर मैं समस्या को पर्याप्त सटीकता से समझा दूँ ताकि LLM उसे समझ सके, तो वह ठीक-ठाक नतीजा दे देता है, और निकले हुए code को मैं तुरंत देखकर समझ सकता हूँ कि यही चाहिए या नहीं, लेकिन जो चीज़ मुझे बिल्कुल नहीं आती, वह उसे सौंप दूँ तो मामला और उलझ जाता है
- मुझे लगता है यह पोस्ट (शीर्षक छोड़कर) काफ़ी संतुलित नज़रिया देती है, “सब कुछ LLM को सौंप दो!” समस्याओं से भरा है, जबकि “समय बचाने के लिए repetitive code या test code का कुछ हिस्सा उसे देना ठीक-ठाक है”, बस “AI कभी काम करता है, कभी नहीं” जैसे साधारण शीर्षक से views कभी नहीं आएँगे
- AI contractor (outsourcing) से ज़्यादा एक intern जैसा लगता है
“पर्याप्त context भी पर्याप्त नहीं होता” वाली बात से गहरी सहमति है, हम चाहे कितना भी context भर दें, AI ज़्यादातर feedback माँगे बिना अपनी तरफ़ से अंदाज़ा लगाता है और असफल हो जाता है, मुझे एक TV शो का वह दृश्य याद आता है जिसमें कोई genie से wish माँगते समय हर शर्त को वकील की तरह बारीकी से तय करता है, LLM से बात करना भी कुछ वैसा ही लगता है
- AI बिल्कुल उस सहकर्मी जैसा है जो बहुत बुद्धिमान लगता है लेकिन अपने मन की बात कभी साफ़ नहीं बताता, लगता है वह कुछ भी कर सकता है लेकिन teamwork नहीं हो पाता, “मुझे समझ नहीं आ रहा कि यहाँ आप क्या चाहते हैं, थोड़ा और समझाइए” जैसी बात AI से लगभग कभी नहीं आती
- (शायद मुझे पता है आप किस TV scene की बात कर रहे हैं) उस scene में आखिरकार बात ठीक हो गई थी, लेकिन LLM को अपना “वादा” निभाने की कोई ज़रूरत महसूस ही नहीं होती, बल्कि genie ज़्यादा उस पुराने sci-fi AI जैसा है जो नियमों और बंदिशों में जकड़ा होता है, LLM उससे बिल्कुल अलग है
असली coding से ज़्यादा AI के साथ vibe coding करके संवाद करना मुझे पसंद नहीं, उसकी जगह मैंने अपने development process को काफ़ी पहले से ज़्यादा structured बनाना शुरू किया है, पहले spec file लिखता हूँ, फिर LLM से codebase और online information के आधार पर requirements के उन हिस्सों को साफ़ करवाता हूँ जिन्हें स्पष्ट करना चाहिए, और implementation steps को step-by-step checklist में तोड़ने को कहता हूँ, हर step पूरा होने के बाद ही अगली session में जाता हूँ ताकि चीज़ें निखरें, और अगर AI के साथ बातचीत थका दे तो मैं खुद या टीम का कोई सदस्य spec के हिसाब से implementation कर सकता है, इसलिए इसका इस्तेमाल काफ़ी लचीला हो जाता है
हाल की एक project में मैंने AI coding अपनाई, vibe coding ठीक-ठीक क्या है यह नहीं जानता, लेकिन मेरा चुना हुआ तरीका धीमा, आराम से होने वाला iterative interaction है, मैंने Gemini AI studio का इस्तेमाल किया और नतीजों से इतना संतुष्ट रहा कि पूरी प्रक्रिया को document करके open source project के रूप में जारी कर दिया, इससे मेरी productivity में साफ़ बढ़ोतरी हुई, एक कमी यह लगी कि AI ज़रूरत से ज़्यादा विनम्र बोलता है, मेरी राय में AI का ROI तब सबसे ज़्यादा होता है जब मुझे मनचाहा outcome साफ़ पता हो और रास्ते में options की तुलना करनी हो, मैंने project के सभी outputs पर इसका उपयोग किया: core code, test cases, build scripts, documentation, sample app, utilities, पूरी development transcript यहाँ देखी जा सकती है, और project source यहाँ है
मैं भी AI का उपयोग लगभग इसी तरीके से करता हूँ, revolutionary abstraction जैसी चीज़ों की AI से उम्मीद करना ज़्यादा है, लेकिन जिस बेहद साधारण रास्ते पर हज़ारों developers पहले चल चुके हैं, वहाँ यह अच्छी तरह काम करता है, उस अर्थ में यह एक बहुत powerful search engine जैसा है
- मुझे लगता है ChatGPT दरअसल वही search engine है जो Google को बनाना चाहिए था, लेकिन Google अपने मौजूदा business को छेड़ना नहीं चाहता था, इसलिए उसने देर की
मेरा पसंदीदा तरीका यह है कि LLM से शुरुआती solution या code example संक्षेप में ले लूँ, उसके बाद prompt को बार-बार refine करने के बजाय सीधे खुद आगे काम करूँ, और अंत में ज़रूरत हो तो LLM से अपने code की review करा लूँ, इसका सबसे बड़ा फ़ायदा यह है कि prompt-refinement loop से बच जाते हैं, यह loop बेहद उबाऊ है, बहुत समय खा जाता है, और लंबे समय में productivity भी घटा सकता है
यह बात कि AI feedback या स्पष्ट सवाल पूछे बिना बस आगे बढ़ता रहता है, वाकई बहुत निराशाजनक है
हमारी team की राय यह है कि “मौजूदा स्थिति में AI को बस यहीं तक इस्तेमाल करेंगे, और अगर आगे चलकर तकनीक में बुनियादी बदलाव आए तो फिर स्थिति दोबारा देखेंगे”, सवाल यह है कि क्या LLM इससे ज़्यादा कर पाएँगे, मुझे अब भी लगता है कि अगर सही तरह इस्तेमाल किया जाए तो वे बहुत उपयोगी हैं
- LLM और ज़्यादा काम कर सकते हैं या नहीं, इस पर शक मुझे समझ नहीं आता, मुझे हर दिन LLM-आधारित tools को बेहतर बनाने के कई नए ideas आते हैं, और उनमें से ज़्यादातर साधारण engineering work हैं, चाहूँ तो सब खुद बना सकता हूँ, भले ही ईश्वर सचमुच LLM model training को रोक दे, तब भी मुझे यक़ीन है कि कई दशकों तक 10x से भी ज़्यादा productivity boost निकाला जा सकता है, अगर इसे सही software development और QA process के साथ जोड़ा जाए तो सिर्फ agentic wrappers या pipeline improvements से भी बहुत बड़ी प्रगति संभव है
facebook ads सुधारने के लिए AI का उपयोग करना, Dark Tower series के breakers जैसा है