- कई मुफ़्त web AI models को साथ-साथ इस्तेमाल करके समस्या-समाधान और code generation को अलग रखें, और हर model की ताकत का लाभ उठाने वाली hybrid strategy अपनाएँ
- AI Code Prep GUI से केवल ज़रूरी code चुनकर व्यवस्थित करें ताकि अनावश्यक context से performance कम न हो, और AI को सिर्फ़ core context दें
- planning और debugging के लिए high-performance/free models (Gemini 2.5 Pro, o3, o4-mini, Claude 4 आदि) का उपयोग करें, जबकि execution और code writing के लिए GPT-4.1·Claude 3.5 का उपयोग करें
- OpenAI data sharing, GitHub Copilot, Poe.com, OpenRouter आदि से मुफ़्त या सस्ते tokens हासिल करके cost कम से कम रखें
- Claude Code, Qwen Code, Gemini CLI, Roo Code, Trae IDE जैसे अलग-अलग agent·CLI tools को परिस्थिति के अनुसार मिलाकर काम की efficiency बढ़ाएँ
My Browser Setup: The Free AI Buffet
- मैं browser में कई ताकतवर AI models के मुफ़्त versions अलग-अलग tabs में खोलकर रखता हूँ
- यह एक ही model पर निर्भर रहने के बजाय, कई नज़रियों से जवाब पाने का तरीका है। जिन मुफ़्त model combinations का मैं सबसे ज़्यादा उपयोग करता हूँ, वे इस प्रकार हैं।
- GLM 4.5: web पर मुफ़्त उपलब्ध है, और अनुभव के हिसाब से Claude 4 स्तर या उससे बेहतर performance देता है। मैं हमेशा 2~3 tabs खोलकर रखता हूँ
- Kimi K2: Claude या Opus series जैसा model, जो web पर मुफ़्त उपलब्ध है। आमतौर पर 1~2 tabs खोलता हूँ, और GLM 4.5 आने से पहले यह दिन में कई बार मुश्किल bugs हल कर देता था
- Qwen3 Coder और नए models: अलग-अलग coding-focused models को test करने के लिए उपयोग करता हूँ
- OpenAI Playground: GPT-4.5, o3 जैसे कई models को मुफ़्त इस्तेमाल किया जा सकता है। अगर account data settings में "OpenAI can use data for model training" की अनुमति दें, तो मुफ़्त tokens मिलते हैं
- Google Gemini AI Studio: Gemini 2.5 Pro/Flash models को लगभग मुफ़्त और लगभग unlimited तरीके से इस्तेमाल किया जा सकता है। मैं आमतौर पर 1~3 tabs खोलकर रखता हूँ
- Google Gemini 2.5 Pro: यह AI Studio से अलग service है, और image generation तथा deep research features में बेहतर है। मैं इसे AI Studio के साथ parallel tabs में इस्तेमाल करता हूँ
- Poe.com: Claude 4 या o4-mini जैसे premium models के लिए daily free credits देता है
- OpenRouter: मुफ़्त और paid models का मिश्रित उपयोग संभव है। मैं कई models को अलग-अलग tabs में set करके रखता हूँ
- ChatGPT: इसका मुफ़्त version भी अभी काफ़ी उपयोगी है, इसलिए कम से कम 1 tab खुला रखता हूँ
- Perplexity AI: research-केंद्रित सवालों में मज़बूत
- Deepseek: v3 और r1 models मुफ़्त देता है। लेकिन context limits का ध्यान रखें
- Grok.com: सामान्य उपयोग, deep research और image editing के लिए unlimited free access देता है। खास तौर पर इसका deep research feature Perplexity जैसा उपयोगी है
- Phind: जवाबों के साथ flowcharts या diagrams देने की कोशिश करता है
- lmarena.ai: Claude Opus 4 और Sonnet 4 मुफ़्त देता है। Opus 4 का मुफ़्त उपयोग काफ़ी मूल्यवान है
Claude.ai खुद भी मुफ़्त है, लेकिन usage limits बार-बार आने से असुविधा हो सकती है, इसलिए Cody extension या Copilot जैसी दूसरी approaches का उपयोग किया जाता है।
ध्यान देने योग्य बात – Grok का उपयोग करते समय
Grok मुफ़्त compute और बिना censor की गई image generation देता है, इसलिए जब दूसरे models के safety systems बाधा बनते हैं, तब यह उपयोगी हो सकता है। हालांकि, ऐसी रिपोर्टें हैं कि इसके operators नाज़ी-संबंधित विचारों या misinformation को बढ़ावा देने की मंशा रख सकते हैं। खासकर यह दावा भी हुआ है कि इसे अफ्रीका में genocide जैसी ऐतिहासिक घटनाओं पर झूठी जानकारी देने के निर्देश दिए गए थे। ऐसी विकृतियाँ मुख्य रूप से X platform पर दिखाई देती हैं, लेकिन इसे coding जैसे सुरक्षित उपयोगों तक सीमित रखना या संभावित bias को ध्यान में रखकर इस्तेमाल करना बेहतर है।
A smarter, cheaper workflow: Focused Context
- web-based AI chat interfaces (AI Studio, ChatGPT, OpenRouter आदि) का उपयोग करते समय, कई बार वे IDE या agent frameworks (Cline, Trae, Copilot आदि) की तुलना में problem solving या solution suggestions में बेहतर साबित होते हैं
- अगर Cursor, Cline, Roo Code जैसे tools से हर काम कराया जाए, तो MCP server usage या file editing procedures जैसी बड़ी मात्रा में ऐसी text AI को भेजी जाती है जो समस्या से सीधे संबंधित नहीं होती, जिससे AI भ्रमित होता है और performance गिरती है
- इसी वजह से, सबसे महंगे models का उपयोग करने पर भी अनावश्यक जानकारी से पैदा होने वाले ‘slowdown effect’ को पार नहीं किया जा सकता
- इसलिए, मैं समस्या-समाधान के लिए ज़रूरी सटीक context खुद तैयार करके उसे web-based AI chat में paste करता हूँ और सवाल पूछता हूँ या code review माँगता हूँ
- जब solution मिल जाता है, तो उसी बात को Cline जैसे agents के लिए prompt के रूप में लिखकर उनसे सिर्फ़ file editing करवाता हूँ
- इस तरह GPT-4.1 (जिसका unlimited उपयोग संभव है) का इस्तेमाल करके कम लागत में problem solving और planning की जा सकती है, और बेवजह Claude credits खर्च करने की ज़रूरत नहीं पड़ती
- मुश्किल समस्या-समाधान के लिए Claude और execution के लिए web chat AI को साथ में इस्तेमाल करके efficiency बढ़ाई जाती है
-
How AI Code Prep Helps (Example Prompt Structure)
example prompt:
Can you help me figure out why my program does x instead of y?- AI Code Prep GUI project folder को recursively scan करता है, subfolders और files तक सब कुछ देखता है, फिर code और सवाल को AI के लिए आसान format में व्यवस्थित करता है
- generated context का उदाहरण:
Can you help me figure out why my program does x instead of y? fileName.js: <code> ... 파일 내용 ... </code> nextFile.py: <code> import example ... 기타 내용 ... </code> Can you help me figure out why my program does x instead of y?- सवाल को दो बार दोहराया जाता है (ऊपर/नीचे/दोनों तरफ़ चुन सकते हैं) ताकि AI focus बनाए रखे
- Windows में project folder के अंदर mouse right-click → "AI Code Prep GUI" चलाएँ → code files अपने-आप चुनी जाती हैं, और
node_modules,.gitजैसी अनावश्यक directories अपने-आप exclude हो जाती हैं - selection पूरी तरह सही न भी हो, तो checkbox के ज़रिए आसानी से समायोजित किया जा सकता है
- जब बड़े project के कारण AI context limit पार हो जाए, तब केवल ज़रूरी files चुनकर दी जा सकती हैं
-
यह तरीका क्यों महत्वपूर्ण है?
- Cline, GitHub Copilot, Cursor, Windsurf जैसे कई code agents context बहुत ज़्यादा या बहुत कम भेजते हैं, इसलिए वे inefficient हो जाते हैं
- files को खुद चुनने पर, बिना अनावश्यक data के सिर्फ़ ज़रूरी जानकारी AI को दी जा सकती है
- GUI-based होने की वजह से, यह CLI या public GitHub links माँगने वाले दूसरे context-generation tools की तुलना में private code security और convenience दोनों में बेहतर है
- latest feature updates के लिए wuu73.org/aicp देखें
Model Strategy: काम के लिए सही दिमाग चुनना
- कई शक्तिशाली AI मॉडल वेब इंटरफ़ेस के जरिए मुफ़्त में उपलब्ध हैं (AI Studio में Gemini, Grok, Deepseek आदि), इसलिए पहले इन्हें प्राथमिकता से उपयोग करें
- Poe.com Claude और नई o4 series जैसे टॉप-टियर मॉडल के लिए मुफ़्त daily credits देता है
- Gemini 2.5 Pro (AI Studio में उपलब्ध) debugging, planning और overall काम में बेहद शानदार है, इसलिए इसे अभी सबसे versatile मॉडल माना जा सकता है
- मुश्किल समस्याओं के लिए o4-mini (OpenRouter या Poe पर उपलब्ध) आज़माएँ
- API usage में इसकी लागत पुराने टॉप-टियर मॉडल (Claude 3.5/3.7/4) की तुलना में काफी कम है
- ऐसा अनुभव रहा है कि इसने ऐसे bug को तुरंत हल कर दिया जिसे सुलझाना कठिन था
- Claude 3.7 या 4 को Poe, API (OpenRouter), GitHub Copilot Chat आदि के जरिए एक्सेस किया जा सकता है
- कुछ मुफ़्त usage मिलता है, लेकिन बार-बार इस्तेमाल करने पर लागत का बोझ बढ़ सकता है
- 3.7/4 creative और explosive output ('Hunter S. Thompson' style) देते हैं, लेकिन actual coding को शांत स्वभाव वाले Claude 3.5 पर छोड़ना ज़्यादा efficient हो सकता है
-
OpenAI Playground के मुफ़्त tokens का उपयोग कैसे करें
- अगर OpenAI account में data sharing setting को enable किया जाए, तो हर दिन बड़ी मात्रा में मुफ़्त tokens इस्तेमाल किए जा सकते हैं
- OpenAI Playground → ऊपर दाईं ओर settings icon → बाएँ मेनू में Data Controls → Sharing में "Share inputs and outputs with OpenAI" को enable करने पर ये फायदे मिलते हैं:
- हर दिन अधिकतम 2.5 लाख tokens: gpt-5, gpt-4.1, gpt-4o, o1, o3
- हर दिन अधिकतम 25 लाख tokens: gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, codex-mini-latest
- इस setting का उपयोग करके o3 और GPT-4.5 जैसे टॉप-टियर मॉडल मुफ़्त में बड़ी मात्रा में इस्तेमाल किए जा सकते हैं
- OpenAI Playground में o3 और o4-mini को साथ-साथ चलाकर तुलना की जा सकती है, ताकि हर मॉडल की ताकत और उपयोग समझे जा सकें
-
सुझाई गई मॉडल-वार उपयोग रणनीति
- Gemini 2.5 Pro: debugging, planning और overall coding tasks में सर्वोच्च प्राथमिकता
- o4-mini: कठिन bug सुलझाने के लिए, बेहतरीन cost efficiency
- Claude 4 / 3.7: urgent और कठिन समस्याओं के समाधान के लिए सर्वोत्तम, लेकिन accessibility और cost सीमित
- Claude 3.5: 3.7/4 के creative outputs को refine करने या actual code लिखने के लिए उपयुक्त
- o3, GPT-4.5, Qwen3 Coder 480b, GLM 4.5: complex problems सुलझाने की क्षमता बहुत मजबूत, और मुफ़्त token settings के साथ बड़े पैमाने पर उपयोग संभव
The Hybrid Approach: Premium Planning + Budget Execution
- अलग-अलग मॉडल टेस्ट करने के बाद, quality और cost efficiency दोनों को अधिकतम करने वाली एक hybrid strategy विकसित की गई
- मुख्य insight यह है कि हर मॉडल development process के अलग-अलग चरणों में मजबूत होता है
"Smart Juice" सिद्धांत – AI बेवकूफ़ क्यों हो जाता है
मॉडल को मिलने वाली 'intelligence energy' सीमित होती है।
अगर आप संक्षिप्त और focused prompt भेजते हैं, तो उस energy का लगभग 100% समस्या समाधान में उपयोग होता है।
लेकिन अगर आप अनावश्यक रूप से जटिल input भेजते हैं (tool usage पर लंबा विवरण, समस्या से असंबंधित context, कई पेज का code आदि), तो उसका बड़ा हिस्सा इन्हें प्रोसेस करने में खर्च हो जाता है, जिससे असली समस्या सुलझाने के लिए उपलब्ध 'intelligence' कम हो जाती है।उदाहरण: Cursor, Cline जैसे IDE-integrated agents सवाल से पहले बहुत सारे निर्देश और context भेजते हैं, इसलिए मॉडल का focus कम हो जाता है।
इसलिए अनावश्यक context घटाना और केवल समस्या समाधान के लिए ज़रूरी बातें भेजना सबसे बेहतर परिणाम पाने का तरीका है।
-
नया प्रोजेक्ट शुरू करते समय workflow
- 1. Plan & Brainstorm
- smart और मुफ़्त web models (Gemini 2.5, o4-mini, Claude 3.7/4, o3 आदि) से approach design करें, step-by-step plan बनाएँ, और ज़रूरी libraries पहचानें।
- 2. Generate Agent Prompt
- ऊपर दिए गए मॉडलों में से किसी एक से यह अनुरोध करें:
"Write a detailed-enough prompt for [Cline](https://cline.bot/), my AI coding agent, to complete the following tasks: [작업 설명]" - बने हुए prompt को ChatGPT जैसे rewriting में अच्छे मुफ़्त AI से एक बार और polish करें।
- ऊपर दिए गए मॉडलों में से किसी एक से यह अनुरोध करें:
- 3. Execute with Cline
- polished prompt को Cline में paste करें, और GPT 4.1 या Claude 3.5 (complex tasks के लिए Claude 4) के साथ चलाएँ।
- GPT 4.1 family निर्देशों का पालन करने की training में काफी अच्छी है।
- 4. Fallback
- अगर GPT 4.1 fail हो जाए, तो API के जरिए Claude 3.5 पर switch करें।
- Deepseek v3 या R1 भी instructions follow करने में बहुत मजबूत हैं।
- 1. Plan & Brainstorm
-
मुख्य रणनीति
- महंगे और smart मॉडल (या मुफ़्त में उपलब्ध Gemini 2.5 Pro) का उपयोग strategy और design चरणों के लिए करें।
- plan को 2~3 अलग मुफ़्त models (Deepseek R1, Poe का Claude आदि) में paste करके verify करें:
"Is this good? Can you improve it or find flaws?" - coding और execution चरण के लिए stable और efficient models (GPT 4.1, Claude 3.5) को Cline में इस्तेमाल करें।
-
मॉडल-वार उपयोग टिप्स
- o4-mini
- complex code logic की व्याख्या, framework·library selection जैसी high-level implementation strategy में मजबूत।
- idea brainstorming
- जब समाधान न मिले
- अगर मुफ़्त/कम-लागत मॉडल से समाधान न निकले, तो API के जरिए advanced और paid model पर escalation करें।
- o4-mini
Alternative Agents & Setups
- Trae.ai (Bytedance, TikTok की निर्माता)
- VS Code-संगत IDE, मुफ़्त AI उपयोग देता है: Claude 4, Claude 3.7, Claude 3.5, GPT 4.1 शामिल।
- बिल्ट-इन एजेंट का प्रदर्शन Cline से कम है (सच कहें तो Cline सबसे ताकतवर है)।
- यह VS Code क्लोन के रूप में है, इसलिए Cline एक्सटेंशन इंस्टॉल किया जा सकने की संभावना है।
- लेकिन सर्वर ओवरलोड की वजह से गति धीमी → मुफ़्त उपयोग की व्यावहारिकता कम।
- फिर भी मुफ़्त मॉडल एक्सेस होने के कारण इसका ज़िक्र किया गया है।
-
सुझाई गई 2 सेटिंग्स
- 1. VS Code + Cline + Copilot
- Copilot का $10/माह सब्सक्रिप्शन → Cline में कम लागत पर शक्तिशाली मॉडल API इस्तेमाल किए जा सकते हैं।
- मुफ़्त टियर में भी कुछ बुनियादी फीचर इस्तेमाल किए जा सकते हैं।
- 2. Trae.ai + Cline
- Trae की मुफ़्त मॉडल एक्सेस + Cline API key के संयुक्त उपयोग की संभावना की जाँच।
टिप: Copilot का डिफ़ॉल्ट एजेंट कभी-कभी ऐसी समस्याएँ हल कर देता है जिन्हें Cline ठीक से नहीं कर पाता, और इसका उलटा भी होता है।
Cline कभी-कभी बहुत लंबे prompts भेजता है जिससे प्रदर्शन गिर सकता है → ऐसे मामलों में Copilot बेहतर हो सकता है। - 1. VS Code + Cline + Copilot
-
Roo Code: Cline का क्लोन
- Roo Code लगभग Cline जैसा है, लेकिन कुछ अलग फीचर देता है।
- प्रोजेक्ट या कोडिंग स्टाइल के हिसाब से Roo Code बेहतर हो सकता है।
- Cline खुद मुफ़्त है, लेकिन API कॉल का शुल्क लगता है।
- सबसे किफ़ायती तरीका: VS Code LM API सेटिंग + Copilot का $10/माह सब्सक्रिप्शन → लगभग असीमित शक्तिशाली मॉडल उपयोग।
-
नए CLI टूल: Claude Code, Qwen Code, Gemini CLI
- हाल में CLI-आधारित कोडिंग टूल्स में रुचि तेज़ी से बढ़ी है।
- Claude Code: subagent सपोर्ट → एक समय में एक ही काम करता है, अतिरिक्त टूल्स का उपयोग नहीं करता।
- इस गाइड में बताए गए ‘स्मार्ट जूस’ केंद्रित workflow को फिर से बनाया जा सकता है।
- अनावश्यक agent निर्देशों (bloat) को हटाकर दक्षता बनाए रखता है।
- Qwen Code, Gemini CLI के भी अपने-अपने फ़ायदे हैं।
- Claude Code को GLM 4.5 के साथ इस्तेमाल करने की सेटअप गाइड z.ai साइट पर है।
- हर CLI टूल की अलग ताकत है, इसलिए गाइड और कम्युनिटी टिप्स देखकर प्रयोग करने की सलाह है।
TL;DR: Quickstart Guide
- Models & Roles
- Planning & Brainstorming
GLM 4.5, Kimi K2, नवीनतम Qwen3 Coder & 2507 सीरीज़, Gemini 2.5 Pro (AI Studio), o4-mini (OpenRouter), Claude 3.7/4 (Poe), OpenAI Playground में प्रतिदिन 250k मुफ़्त tokens (o3, GPT-5) के उपयोग की सिफ़ारिश - Problem Solving & Debugging
GPT-5 (Playground मुफ़्त tokens), GLM-4.5 (Claude 4 स्तर का प्रदर्शन), Claude 4 (Poe के मुफ़्त दैनिक tokens) - Actual Coding
GPT-4.1 (Cline), असफल होने पर Claude 3.5 विकल्प के रूप में, या Qwen3 Coder, Instruct, 2507, GLM 4.5, Kimi K2 का उपयोग
- Planning & Brainstorming
- Key Tools
- VS Code
- AI Code Prep GUI – लोकल में सिर्फ़ ज़रूरी फ़ाइलें स्कैन और चुनकर AI context को optimize करता है
- Cline (VS Code agent) – चरण-दर-चरण कोड निष्पादन
- मुफ़्त web chat – Poe.com, ChatGPT, Grok, Deepseek, Perplexity, OpenAI Playground, AI Studio (Gemini 2.5 Pro), OpenRouter, duck.ai
- Quick Workflow
- AI Code Prep GUI से प्रोजेक्ट-संबंधित फ़ाइलों को bundle करें
- उस context को अपने पसंदीदा web chat मॉडल में paste करके planning और debugging करें
- किसी एक मॉडल से
"इस काम के लिए विस्तृत Cline prompt लिखो"कहलवाएँ, फिर ChatGPT आदि में उसे refine करें - तैयार prompt को GPT-4.1 पर सेट किए गए Cline में paste करके कोड generate या modify करें
→ असफल होने पर Claude 3.5 पर स्विच करें
- Cost-Saving Hacks
- OpenAI Playground में “data sharing” सक्षम करें → प्रतिदिन 250k मुफ़्त tokens (GPT-4.5, o3) + प्रतिदिन 2.5M मुफ़्त tokens (o4-mini, o3-mini)
- GitHub Copilot का $10/माह सब्सक्रिप्शन → Cline में Claude models का सीमित उपयोग संभव
- OpenRouter pay-as-you-go → o4-mini, Claude 3.7 जैसे नए models कम लागत में उपयोग
Some Thoughts
- AI एक अद्भुत productivity amplifier है, लेकिन यह कोई जादुई छड़ी नहीं है।
- असली जादू तब होता है जब आपकी जिज्ञासा, दृढ़ता, और प्रयोग करने की इच्छा इन शक्तिशाली टूल्स के साथ मिलती है।
- bugs या समस्याओं से निराश मत हों — हर चुनौती कुछ नया सीखने का मौका है।
- मॉडल्स को मिलाकर इस्तेमाल करें, साहसी विचार आज़माएँ, और तोड़कर फिर से बनाने से मत डरें।
- सबसे अच्छे डेवलपर वे नहीं होते जो कभी अटकते नहीं, बल्कि वे होते हैं जो अटकने पर भी आगे बढ़ते रहते हैं और हर टूल और तकनीक का इस्तेमाल करते हैं।
- अव्यवस्था को अपनाइए, प्रक्रिया का आनंद लीजिए, और आपकी रचनात्मकता को रास्ता दिखाने दीजिए!
Latest Model Updates (Aug 2025)
💰 Budget-Conscious: Getting Max Value
-
GPT 4.5
- Status: बंद कर दिया गया
-
o3
- क्षमता: Claude 4 के बराबरी का प्रदर्शन, कठिन समस्याएँ हल करने में बेहतरीन, जीनियस-स्तर
- उपयोग टिप: AI Code Prep GUI से पूरा codebase डालकर विश्लेषण किया जा सकता है
- Free Tokens: Data Controls/Sharing settings में data sharing सक्षम करने पर 250k tokens/दिन
-
o4-mini
- क्षमता: o3 से थोड़ा कम, लेकिन बहुत शानदार प्रदर्शन, जैसे o3 का छोटा भाई मॉडल
- Free Tokens: data sharing सक्षम करने पर 2.5M tokens/दिन
-
Gemini 2.5 Pro
- उपयोग: AI Studio में मुफ़्त
- विशेषता: जटिल debugging, architecture design और planning
-
Deepseek R1 0528
- क्षमता: बेहतर reasoning performance वाला बेहद स्मार्ट मॉडल
- उपयोग: Deepseek web interface में मुफ़्त इस्तेमाल संभव
🚀 Premium: Fix Problems NOW
-
Claude 4 Sonnet
- क्षमता: पर्याप्त context देने पर ज़्यादातर समस्याएँ एक ही बार में हल कर देता है
- विशेषता: लेखन, problem solving आदि में कुल मिलाकर बेहतरीन प्रदर्शन
- उपयोग: जब पहली ही कोशिश में सही समाधान ज़रूरी हो
-
Claude 4 Opus
- कीमत: $75 / 1M tokens
- प्रदर्शन: Sonnet से भी बेहतर माने जाने वाला “magic sauce” स्तर का प्रदर्शन
- उपयोग: जब अंतिम स्तर की problem solving चाहिए
Solid Worker Models
निम्न मॉडल निर्देशों का अच्छी तरह पालन करते हैं और स्थिर रूप से काम पूरा करते हैं:
-
GPT 4.1
- एक top-tier smart मॉडल, जिसे डिज़ाइन और problem solving के बाद वास्तविक code edits के लिए उपयोग किया जा सकता है
- कहीं से भी मिला output सीधे Cline में पेस्ट करके चलाया जा सकता है
-
Claude Sonnet 3.5
- coding और editing में मजबूत
- 4.1 से थोड़ा धीमा, लेकिन बहुत स्थिर
-
Deepseek v3
- code लिखने, संशोधित करने और agent tasks के लिए उपयुक्त
- कीमत के मुकाबले प्रदर्शन बेहतरीन
-
OpenRouter Free Models
- OpenRouter पर price filter को
$0पर सेट करके free models खोजें - नए मॉडल आते ही उन पर प्रयोग करना फायदेमंद हो सकता है
- OpenRouter पर price filter को
Free Claude 4: lmarena.ai, and More
Claude Opus 4 and Sonnet 4
- lmarena.ai पर Claude Opus 4, Sonnet 4 आदि मुफ्त में उपलब्ध हैं
- टिप: Anthropic परिवार के मॉडलों को मुफ्त में इस्तेमाल करने के मौके ज़रूर सहेजें, याद रखें और उपयोग करें
- उपयोग: जब बाकी सब विफल हो जाए, या काम तुरंत और पूरी तरह सही तरीके से पूरा करना हो, तब Claude 4 Sonnet या Opus चुनें
NEW!! Bad ass new Chinese models + GPT 5
-
GLM 4.5
- प्रदर्शन: Claude 4 Opus या Sonnet के समान
- विशेषता: agent rules और tool usage को लगभग पूरी तरह सही ढंग से निभाता है
- उपयोग: बेहद कठिन bug fixes और बहुत अधिक context मांगने वाले जटिल कामों के लिए मजबूत
-
Qwen3 Coder 480B
- मूल्यांकन: शक्तिशाली और सस्ता, इसलिए काफी पसंद किया जाने वाला मॉडल
- उपयोग: high-performance, low-cost coding environments में coding tasks
-
Qwen3 Instruct & Thinking 2507
- प्रदर्शन: Qwen3 Coder जैसी स्थिरता और ताकत
- फायदा: भरोसेमंद और cost-effective
-
Kimi K2 (Moonshot)
- विशेषता: इसका स्वभाव ऐसा लगता है मानो इसे Anthropic-आधारित या Claude-जैसे synthetic data पर train किया गया हो
- मूल्यांकन: बहुत शानदार प्रदर्शन, और अक्सर इस्तेमाल किया जाने वाला मॉडल
-
GPT 5
- सीमाएँ: custom tools के उपयोग (MCP, Cline आदि) में इसकी बढ़त कम है
- सुझाया गया उपयोग:
1. GPT 5, GLM 4.5 जैसे बेहतरीन मॉडलों से planning और problem solving कराएँ
2. उसके बाद prompt लिखें ताकि कोई सरल agent मॉडल वास्तविक edits और tool usage संभाल सके - तुलना:
- GPT 4.1 अब भी cost-performance के हिसाब से बहुत अच्छा value देता है
- नए Chinese models custom tools/Cline usage में मजबूत हैं
- कुल मिलाकर: अभी इतना व्यापक प्रयोग नहीं किया गया है, लेकिन हर मॉडल की अपनी ताकत है, और फिलहाल कीमत व स्थिरता के लिहाज से Chinese models बहुत आकर्षक हैं
Current Coding Workflow (2025)
-
For New Projects:
- 1. Planning Phase:
- project की सारी details (language, libraries, server आदि) notepad में लिखें
- 2. Multi-Model Consultation:
- वही सामग्री कई मॉडलों में पेस्ट करके ‘कई विशेषज्ञों की राय’ लें:
- Gemini 2.5 Pro (मुफ्त)
- GPT 4.1
- o4-mini
- Claude 4 (Poe के free daily credits का उपयोग)
- वही सामग्री कई मॉडलों में पेस्ट करके ‘कई विशेषज्ञों की राय’ लें:
- 3. Refinement:
- मॉडल के साथ बार-बार बातचीत करके details को fine-tune करें
- 4. Task Generation:
- मॉडल से Cline AI coding agent के लिए step-by-step task list लिखने को कहें
- 5. Execution:
- Cline (या Roo Code) में GPT 4.1 को
actmode पर सेट करके काम चलाएँ
- Cline (या Roo Code) में GPT 4.1 को
- 1. Planning Phase:
-
For Problem Solving:
- जटिल codebase analysis: GPT 4.5 + AI Code Prep का उपयोग
- GPT 4.5 से कहें: “एक prompt लिखो ताकि Cline यह काम पूरा कर सके”
- समस्या की जटिलता के अनुसार मॉडल चुनें
- अलग-अलग मॉडलों का उपयोग करके कई कोणों से समाधान खोजें
-
Task List & Test Driven Development (Coming Soon)
Test Driven Development & Task Lists:- AI से Cline, Roo Code, Trae agent चलाने के लिए विस्तृत task list लिखने को कहें
- Cline या Roo Code को यह निर्देश दिया जा सकता है कि वे Markdown file में task progress लिखें और पूरा होने पर उसे check करें
- इससे progress को आसानी से track किया जा सकता है और कुछ छूटने से बचा जा सकता है
- फिलहाल, मॉडल से Markdown checklist बनवाकर, फिर Cline या Roo Code से उस file को update करवाने के तरीके पर प्रयोग किया जा सकता है
-
Money-Saving Hacks
- GPT 4.5 & o3: अगर model training data sharing चालू करें, तो रोज़ 250,000 tokens मुफ्त मिलते हैं
- सस्ते मॉडल: o4-mini, 4.1-mini/nano पर रोज़ 2.5 million tokens इस्तेमाल किए जा सकते हैं
- GitHub Copilot: $10 प्रति माह में नए Claude models का उपयोग संभव है (speed limit के साथ)
- Trae IDE: फिलहाल Claude 4 और GPT 4.1 मुफ्त में उपलब्ध हैं (subscription की जरूरत नहीं, और लगता है कोई सीमा भी नहीं है)
- Poe.com: सभी मॉडलों के लिए free daily credits देता है
- Web Interfaces: planning और consultation के लिए मुफ्त web chat interfaces का उपयोग करें
-
Coming Soon: Live Reddit Data & Insights
Live Reddit Data Scraping & Daily Insights:- Reddit data को real time में scrape करके, AI models के उपयोग के मामलों पर रोज़ अपडेटेड जानकारी देने की योजना है
- इसमें detailed usage analysis, data visualization, और वास्तविक coding workflows व trends पर नए insights शामिल होंगे
1 टिप्पणियां
Hacker News राय
जिन लोगों को शायद भ्रम हुआ हो, उनके लिए बता दूँ कि मुख्य लेख के 2–3 और पेज हैं, और नीचे मौजूद arrow आइकन से उन तक पहुँचा जा सकता है
मैं ही इस लेख का लेखक हूँ, इसलिए फ़ॉन्ट की समस्या के लिए माफ़ी चाहता हूँ। सामग्री थोड़ी पुरानी हो गई है, लेकिन AI क्षेत्र इतनी तेज़ी से बदलता है कि मैं इसे नए models समेत अपडेट करने वाला हूँ। आजकल नए models बहुत तेज़ी से आ रहे हैं, और निजी तौर पर हाल में मेरा सबसे पसंदीदा GLM-4.5 है। Kimi K2 भी अच्छा है, और Qwen3-Coder 480b या 2507 instruct भी काफ़ी अच्छे हैं। ऐसे models किसी भी agentic environment या agent tool में बहुत अच्छा काम करते हैं मैंने अपना context helper app भी बनाया है(https://wuu73.org/aicp), जिसे इस लिंक पर देखा जा सकता है। जिन कई AI chat tabs और IDEs के बीच मैं अक्सर आता-जाता हूँ, उनके लिए यह बहुत सुविधाजनक है(लगभग हमेशा मुफ़्त, और बेहतरीन नतीजे भी मिलते हैं)। web chat interface इस्तेमाल करते समय जितनी भी झंझट और असुविधा होती है, उसे यथासंभव कम करने की कोशिश की है। यह मुफ़्त है, और feedback बहुत अच्छा मिला है, आलोचनात्मक राय भी स्वागतयोग्य है IDE <----> web chat tab के बीच आना-जाना बहुत आसान हो गया है। मैंने इसे मूल रूप से अपना समय बचाने के लिए बनाया था, और क्योंकि यह PySide6 UI है, इसलिए webview की तुलना में काफ़ी हल्का चलता है। अक्सर इस्तेमाल होने वाले text को preset buttons से तुरंत जोड़ा जा सकता है, और project के हिसाब से window size, इस्तेमाल की गई files जैसी context state भी याद रखता है। अगली बार चलाने पर वही state खुल जाती है यह code files को अपने-आप scan करके उपयोगी files का अनुमान लगाता है। prompt box में code के ऊपर-नीचे text भी जोड़ा जा सकता है(ऐसा करने पर output बेहतर आने की प्रवृत्ति होती है)। निजी तौर पर मेरा एक अक्सर इस्तेमाल होने वाला button इस तरह set है: "Cline(coding agent) के लिए prompt लिखो, पूरे prompt को एक code tag में wrap करो ताकि copy/paste आसान हो, पूरे काम को छोटे-छोटे हिस्सों में बाँटो और इतनी detail व कारण दो कि Cline उसे follow कर सके, और plain language में search and replace blocks भी जोड़ो ताकि edit location तय हो सके" समस्या सुलझाने या bug ढूँढने के लिए मैं आम तौर पर यह तरीका अपनाता हूँ: VS Code में terminal पर
aicpटाइप करके app खोलता हूँ, file fine-tuning, अपनी वांछित explanation या fix दर्ज करता हूँ, Cline button और Generate Context! पर क्लिक करता हूँ, फिर इसे GLM-4.5 में paste करता हूँ। अगर समस्या कठिन हो, तो o3, o4-mini, GPT-5, Gemini 2.5 Pro जैसे 2–3 models पर भी आज़माता हूँ। सबसे तर्कसंगत जवाब चुनकर Cline(VS Code, GPT 4.1 unlimited/free version) में paste करता हूँ। 4.1 बहुत ज़्यादा smart नहीं है, लेकिन निर्देशों का पालन सटीकता से करता है। बड़े models की छोटी-मोटी गलतियाँ भी यह खुद ठीक कर देता है। बड़े models detail, task list बहुत अच्छी तरह लिख देते हैं, और 4.1 उन्हें agent mode में execute करता है इस तरह आप unlimited free में बहुत smart AI के साथ coding कर सकते हैं। अगर MCP(tool वगैरह) को model से जोड़ते हैं तो performance उल्टा घट जाती है, और Claude 4 जैसी API इस्तेमाल करें तो बस ज़्यादा पैसा खर्च होता हैवेबसाइट की scroll speed धीमी है(Firefox Android में sub1-fps), और grok से जुड़ा call-out scroll नहीं किया जा सकता। ऊपर एक संदिग्ध रूप से बहुत बड़ा हरा button भी दिख रहा है जिस पर CSS loaded लिखा है
[https://wuu73.org/aicp] का diagram उपयोगी है, लेकिन क्लिक करने पर full resolution में नहीं खुलता, इसलिए धुंधला दिखता है। Firefox और Chrome दोनों में यही हाल है। GitHub repo में यह साफ़ दिखता है, इसलिए लगता है JS rendering library की समस्या होगी
लेख अच्छा लगा और अपडेट के लिए धन्यवाद। अगर आप Roo Code और Cline के इस्तेमाल के अनुभव के फर्क पर थोड़ा और गहराई से लिख सकें तो मुझे बहुत दिलचस्पी होगी। मैंने अभी तक सिर्फ Roo Code इस्तेमाल किया है, वह दिलचस्प है, लेकिन नतीजे कुछ अस्थिर रहे
क्या आपने Microsoft copilot इस्तेमाल किया है? यह लगभग free openai model जैसा है
आपने कहा कि मुफ़्त में coding हो सकती है, लेकिन OpenAI data settings में तभी मुफ़्त मिलता है जब आप अपनी data को model training में इस्तेमाल करने की अनुमति देते हैं। यानी यह सचमुच "मुफ़्त" नहीं है
मेरा अनुभव भी लेख में कही गई बात से मेल खाता है। agentic features वास्तव में सिर्फ बड़े models पर ही ठीक से काम करते हैं ("काम करते हैं" का मतलब... उदाहरण के लिए OpenAI Codex ने o4-mini के साथ 3 lines बदलने के लिए 200 requests भेजीं) साधारण edits के लिए छोटे models कहीं ज़्यादा तेज़ होते हैं, इसलिए वे बेहतर रहते हैं। इसलिए मेरा ध्यान "सबसे अच्छे" model पर नहीं, बल्कि "जितना बेवकूफ़ मॉडल चल जाए" उस पर है अगर इसे और आगे बढ़ाकर agentic तरीका छोड़ दें, तो बहुत छोटे models से भी बहुत सटीक काम करवाया जा सकता है। अगर आप साफ़-साफ़ बता दें कि क्या चाहिए, तो वे तुरंत diff result दे देते हैं filesytem में घूम-घूमकर ढूँढना मेरे scale पर अलाभकारी है। मैं लगभग पूरा codebase context में डाल सकता हूँ, इसलिए
src/पूरा prompt में फेंक देता हूँ। दूसरे लोगों के projects में boilerplate बहुत होता है, इसलिए gpt-oss-20b जैसे ultra-cheap model से code search के प्रयोग कर रहा हूँ, और ऐसे काम के लिए और छोटे models भी काम के हैं। Patent pending हैमैं भी ऐसा ही सोचता हूँ। Haiku से conversation flow manage हो जाता है, और ज़्यादा जटिल कामों के लिए Gemini 2.5 Pro या GPT-5 जैसे बड़े models को बुलाता हूँ। हाल में Gemini CLI में MCP(${codex mcp}) के ज़रिए Codex इस्तेमाल करने का प्रयोग कर रहा हूँ, और यह बहुत अच्छा चल रहा है। Gemini CLI मुख्यतः Flash आधारित है, लेकिन problem definition और जवाबों के re-evaluation के लिए पर्याप्त है। Claude Code MCP के साथ Gemini 2.5 Pro इस्तेमाल करना भी ऐसा ही है। Claude Code को MCP खुद की तरह इस्तेमाल करना अच्छा नहीं चलता। इस तरीके का मूल विचार, बेशक, Aider से आया है, यानी main·assistant·editor models को साथ इस्तेमाल करने का concept
Aider, agentic नहीं बल्कि coding tool के रूप में, efficiency और effectiveness दोनों का अच्छा संतुलन देता है। यह tree-sitter से repo mapping बनाता है, इसलिए filesystem में भटकने की ज़रूरत बहुत कम हो जाती है। MCP नहीं है, लेकिन shell commands हैं, इसलिए मैं अपने परिचित utilities भी इस्तेमाल कर सकता हूँ। Cerebras जैसे providers के साथ मिलाने पर prompt processing की speed लगभग तुरंत महसूस होती है। बार-बार tool calls का इंतज़ार किए बिना लगातार दखल दिया जा सकता है। छोटे projects में यह बिल्कुल बेहतरीन है
मैं भी धीरे-धीरे इसी सोच की तरफ जा रहा हूँ। मुझे तेज़ और भरोसेमंद tools चाहिए। मेरे लिए flow state बहुत महत्वपूर्ण है, लेकिन agentic coding tools का इंतज़ार करते-करते वह flow टूट जाता है। इसलिए छोटे models, या Cerebras जैसे providers में मेरी दिलचस्पी बढ़ रही है। अगर समस्या का दायरा छोटा हो, तो reliability भी बढ़ती है। निजी तौर पर मैं तुम्हारे इस्तेमाल किए जाने वाले "surgical" tools के बारे में और सुनना चाहूँगा। इस विषय पर हाल में मेरी ब्लॉग पोस्ट में भी तुम्हारी वजह से कई विचार व्यवस्थित हुए
Codex CLI में अब GPT-5 से नीचे के models पर switch नहीं किया जा सकता(API key न हो तो), क्योंकि उनके अनुसार इसकी recommendation नहीं है।
thinking=highoption के साथ चलाने पर यह o4-mini से कहीं बेहतर प्रदर्शन करता है, और o4-mini लगभग gpt-5-thinking-mini जैसा लगता है। codex में वह setting नहीं मिलती, और gpt-5-thinking-high, o1 या o3-pro के क़रीब है"(असल में काम करता है)"... OpenAI Codex ने o4-mini के साथ 3 lines बदलने में 200 requests लगाईं, इस बारे में जो कहा गया, उसके संदर्भ में, मेरे अनुभव में तो सचमुच 3-line task पर कई दिन लगने के मामले भी रहे हैं
मुझे लगता है कि पूरी तरह local, Cursor जैसे cloud की ज़रूरत के बिना चलने वाले stack में huge potential है। उदाहरण के लिए: • agentic/dev कामों के लिए Cursor CLI(https://x.com/cursor_ai/status/1953559384531050724) • CLI-compatible local memory layer - LEANN(97% छोटा index, cloud cost 0, पूरी privacy, https://github.com/yichuan-w/LEANN) या Milvus(हालाँकि इसे अक्सर cloud/token आधारित तरीके से इस्तेमाल किया जाता है) • inference engine के उदाहरण के तौर पर Ollama है, जो local पर OSS GPT models चलाने के लिए बहुत बढ़िया है इस तरीके से पूरी तरह offline, private, और बहुत तेज़ personal dev+AI environment बनाया जा सकता है। LEANN project इसी उपयोग के लिए design किया गया है: tiny footprint, पूरे local environment में semantic search, Claude Code/Cursor–compatible out-of-the-box, और generation को ollama से संभाला जा सकता है। इसमें एक पैसा भी नहीं लगता, और किसी API की भी ज़रूरत नहीं होती। हाँ, setup में थोड़ी मेहनत लगती है। लेकिन काश कोई इसे पूरी तरह open source में आसान बनाकर दे
अगर आप free API ढूँढ रहे हैं, तो Google Gemini में Gemini, खासकर gemini-2.5-pro को thinking feature के साथ मुफ़्त में इस्तेमाल किया जा सकता है। limits काफ़ी ऊँची हैं; मैं benchmark चला रहा हूँ और अभी तक limit तक नहीं पहुँचा। open-weight models जैसे DeepSeek R1, GPT-OSS के लिए भी कई inference providers या hardware कंपनियाँ free API access देती हैं
Gemini 2.5 pro की free limit रोज़ 100 requests है
https://ai.google.dev/gemini-api/docs/rate-limits
ध्यान रहे, अगर यह feature किसी non-sensitive उपयोग के लिए है तो ठीक हो सकता है, लेकिन Google ऐसे interactions को training के लिए इस्तेमाल करता है(paid होने पर नहीं)
मुझे हैरानी हुई कि लेख में उम्मीद से ज़्यादा नई जानकारी थी। मैं आम तौर पर options को इतनी गहराई से नहीं खंगालता, लेकिन इस बार पूरा लेख पढ़ना सही फैसला लगा। और HN comments में भी बहुत व्यावहारिक जानकारी थी, इसलिए सबका धन्यवाद
मैं OP को recommend करना चाहूँगा कि Continue.dev, ollama/lmstudio, और local पर models चलाने के तरीके ज़रूर देखें। कुछ models autocomplete में वास्तव में बहुत अच्छे हैं, और gpt-oss जैसे models reasoning या tool use में भी अच्छे हैं। मेरे लिए यही my goto copilot है
मेरे साथ भी यही है! मैं VSCode में Continue इस्तेमाल कर रहा हूँ, और Qwen के बड़े models या gpt-oss-120b agentic mode में काफ़ी ठीक चलते हैं
मुझे लगता है continue.dev से Zed एक स्तर ऊपर है। वहाँ आप अपनी पसंद का model सीधे इस्तेमाल भी कर सकते हैं
जैसा पोस्ट में कहा गया, coding agents की समस्या यह है कि वे हर request के साथ अपना data + लगभग पूरा codebase भेजते हैं, इसलिए cost बढ़ जाती है। दूसरी ओर AI chat में cost लगभग नज़रअंदाज़ करने लायक होती है। मैं सिर्फ OpenRouter इस्तेमाल करता हूँ, और उससे लगभग सभी models तक पहुँच मिल जाती है। Sonnet पहले मेरा पसंदीदा था, लेकिन Gemini 2.5 Pro आज़माने के बाद लगा कि वह लगभग हमेशा बेहतर है(कमज़ोरी सिर्फ यह है कि यह धीमा है)। सरल सवालों या syntax याद न आने पर Gemini Flash बहुत तेज़ है, इसलिए वह बिल्कुल सही बैठता है
किसी को यह हैरानी हो सकती है कि लोग free tier के लिए अपनी data इतना दे रहे हैं, लेकिन सच यह है कि घर पर अच्छे LLM चलाने के लिए बहुत ज़्यादा संसाधन चाहिए होते हैं, इसलिए मैं तो अपना code देकर मुफ़्त में इस्तेमाल करना बेहतर मानता हूँ। वैसे भी वह code आखिरकार open source होने वाला है
मैं इस दावे से पूरी तरह सहमत हूँ कि "जब आप web chat में AI इस्तेमाल करते हैं(यानी ChatGPT, Openrouter जैसे web interfaces), तो IDE या agent frameworks की तुलना में problem solving या solution suggestions में लगभग हमेशा बेहतर नतीजे मिलते हैं"। IDE से code copy करके web chat में paste करना थोड़ा असुविधाजनक लग सकता है, लेकिन मेरे अनुभव में यह Github copilot या cursor से कहीं बेहतर परिणाम देता है