AI नई तकनीकों को अपनाने में बाधा डाल रहा है
(vale.rocks)- जैसे-जैसे AI मॉडल डेवलपर workflow में integrate हो रहे हैं, वे कुछ खास तकनीकों के इस्तेमाल को बढ़ावा देते हैं या रोकते हैं
- बड़े language model कुछ तकनीकों की ओर झुके हुए जवाब देते हैं, जिसके कारण ऐसी तकनीकों को पहले अपनाने की प्रवृत्ति बन रही है जिन्हें AI आसानी से support कर सके
- पहले भी अच्छी documentation और भरपूर support वाले tools चुने जाते थे, लेकिन समस्या यह बताई जा रही है कि AI इस निर्णय कारक को जरूरत से ज़्यादा बढ़ा देता है
ज्ञान अंतर
- बड़े language model विशाल dataset और लंबे training period से गुजरते हैं, इसलिए release के समय तक उनमें अक्सर पहले से पुराना ज्ञान शामिल होता है
- training cutoff के बाद आई नई तकनीकों के बारे में AI उचित मदद नहीं दे पाता
- उदाहरण: Anthropic, OpenAI आदि के प्रमुख models में लगभग 2023~2024 के आसपास का knowledge cutoff है
- knowledge gap की वजह से नई तकनीक इस्तेमाल करना चाहने वालों को AI support की कमी से असुविधा होती है, और इससे उस तकनीक को अपनाने में देरी होती है
- जिन तकनीकों की पहले से market share है, उनके उत्साही user base के कारण सामग्री इकट्ठी होती रहती है, लेकिन बिल्कुल नई तकनीकों के लिए documentation या blog जैसी सामग्री ही कम बनती है, इसलिए उसे model training में शामिल करना कठिन होता है
- भले ही AI कुछ हद तक internet connection feature देता हो, अक्सर उसे स्पष्ट रूप से माँगना पड़ता है या कई मामलों में वह feature होता ही नहीं
- नई तकनीकों के लिए AI support की कमी → users और सामग्री में कमी → model training data की कमी → फिर से AI support की कमी, ऐसा दुष्चक्र बनने की संभावना है
- जब कोई डेवलपर नवीनतम JavaScript framework इस्तेमाल करना चाहता है और AI से मदद लेना चाहता है, तो अगर model पर्याप्त मार्गदर्शन न दे सके, तो पुराने तरीके के docs या परिचित tools चुनने की प्रेरणा और बढ़ जाती है
system prompt का प्रभाव
- Claude जैसे कुछ AI models अक्सर React और Tailwind के प्रति पसंद दिखाते हैं
- उदाहरण: Claude से “vanilla HTML/CSS/JS का उपयोग करें” कहने पर भी React code सुझाना, या मौजूदा code को React में rewrite करने की कोशिश करना देखा गया
- कुछ models के system prompt (या सार्वजनिक न किए गए feature-specific prompt) में React, Tailwind, Mermaid जैसी कुछ खास libraries या tools का स्पष्ट उल्लेख होता है
- वास्तविक बातचीत के उदाहरण में, Svelte Runes के उपयोग का अनुरोध करने पर model ने React विकल्प सुझाया, और नतीजतन उपयोगकर्ता को React आसानी से स्वीकार करने की दिशा में प्रेरित किया
- उपयोगकर्ता अक्सर सबसे आसान समाधान (Path of least resistance) चुनते हैं, इसलिए AI जो default विकल्प देता है उसका तकनीक चयन पर बड़ा प्रभाव पड़ता है
परीक्षण
- यह जाँचने के लिए एक सरल test किया गया कि जब AI models से नया web app बनाने को कहा जाए तो क्या वे React की सिफारिश करते हैं
- Anthropic Claude 3.5 Sonnet: तीनों बार React + Tailwind के साथ project creation उदाहरण दिया
- OpenAI ChatGPT 4o: तीनों बार React + Tailwind के साथ app बनाया, और Canvas feature से preview भी दिखाया
- Google Gemini 2.0 Flash: तीनों बार vanilla HTML/CSS/JS इस्तेमाल किया, लेकिन React, Angular, Vue के उपयोग की सिफारिश की
- DeepSeek-V3: vanilla HTML/CSS/JS या Node.js, Express.js, MongoDB, Bootstrap जैसी विभिन्न combinations सुझाईं। हालांकि, ठोस code की तुलना में project overview के रूप में सुझाव दिया
- इन परिणामों से पता चलता है कि Claude और ChatGPT React + Tailwind को बहुत अधिक पसंद करते हैं, Gemini HTML/CSS/JS को प्राथमिकता देता है लेकिन React की सिफारिश करता है, और DeepSeek में तकनीकी विविधता सबसे अधिक है लेकिन output quality कुछ हद तक overview-केंद्रित है
पुनरावलोकन
- शुरुआती डेवलपर या केवल prompt के ज़रिए app बनाने वाले लोग ChatGPT आदि के परिणामों को ज्यों का त्यों स्वीकार करने की अधिक संभावना रखते हैं
- कोई दूसरा framework चुनने पर भी, model system prompt जैसी आंतरिक नीतियों के कारण लगातार React की ओर ले जा सकता है
- ऐसा माहौल बन सकता है जिसमें वही तकनीकें चुनी जाएँ जो पहले से AI के साथ अच्छी तरह compatible मानी जाती हैं, और इससे नई या कम प्रचलित तकनीकों के प्रसार में बाधा आती है
- यह माना गया है कि बड़े language model का bias मौजूदा लोकप्रिय तकनीकों की उम्र बढ़ाने और नई तकनीकों के market entry barrier को ऊँचा करने की दिशा में काम करता है
- यह सुझाव दिया गया है कि AI कंपनियों को models के तकनीकी bias की जानकारी स्पष्ट रूप से सार्वजनिक करनी चाहिए
- भविष्य के शोध के लिए, system prompt में शामिल खास तकनीकों के time-series बदलाव और package download trends की तुलना करके उनके सहसंबंध खोजने जैसे तरीके पर विचार किया जा सकता है। हालांकि, variables बहुत अधिक होने के कारण noise भी काफी हो सकता है
[संदर्भ 1] ‘सबसे लोकप्रिय AI chat platform’ लेखक के व्यक्तिपरक अवलोकन पर आधारित है
[संदर्भ 2] Claude और ChatGPT artifact, canvas features के जरिए उपयोगकर्ताओं को आसान और तुरंत परिणाम देते हैं, इसलिए डेवलपमेंट में नए लोगों या नए उपयोगकर्ताओं पर इनका प्रभाव विशेष रूप से बड़ा होता है
4 टिप्पणियां
गरीब और गरीब, अमीर और अमीर वाली ध्रुवीकरण की प्रवृत्ति खत्म... अगर आप कोई नया प्रोडक्ट बनाते हैं, तो कम से कम उसके साथ एक MCP सर्वर भी बनाना होगा...
यह थोड़ा विरोधाभासी लगता है, लेकिन मुझे लगता है कि AI के दौर में प्रतिस्पर्धात्मक बढ़त बनाने का तरीका अपनी स्वयं सीखने की क्षमता को बढ़ाना है।
क्या यह Stack Overflow पर भी लागू नहीं होता?
Hacker News राय
AI नई तकनीकों को अपनाने में बाधा नहीं डालता
OpenAI Codex पेपर में अनुमानित बातें
राय कि नई तकनीक data और salaries को चूस लेने वाला कचरा है
राय कि अगर LLM किसी खास तकनीक का नाम ले, तो वही तकनीक इस्तेमाल करनी चाहिए
राय कि LLMs Elm जैसी language के लिए उपयोगी होंगे
data visualization में matplotlib उपयोग का अनुभव साझा किया गया
नए frameworks और तकनीक अपनाने पर LLMs के प्रभाव को लेकर प्रश्न
Claude 3.5 Sonnet की code generation preference समस्या
नवीनतम JavaScript frameworks का उपयोग करने वाले developers का उदाहरण
Anthropic द्वारा आगे बढ़ाए जा रहे MCP standard का उदाहरण