- कई मुफ़्त web AI models को साथ-साथ इस्तेमाल करके समस्या-समाधान और code generation को अलग रखें, और हर model की ताकत का लाभ उठाने वाली hybrid strategy अपनाएँ
- AI Code Prep GUI से केवल ज़रूरी code चुनकर व्यवस्थित करें ताकि अनावश्यक context से performance कम न हो, और AI को सिर्फ़ core context दें
- planning और debugging के लिए high-performance/free models (Gemini 2.5 Pro, o3, o4-mini, Claude 4 आदि) का उपयोग करें, जबकि execution और code writing के लिए GPT-4.1·Claude 3.5 का उपयोग करें
- OpenAI data sharing, GitHub Copilot, Poe.com, OpenRouter आदि से मुफ़्त या सस्ते tokens हासिल करके cost कम से कम रखें
- Claude Code, Qwen Code, Gemini CLI, Roo Code, Trae IDE जैसे अलग-अलग agent·CLI tools को परिस्थिति के अनुसार मिलाकर काम की efficiency बढ़ाएँ
My Browser Setup: The Free AI Buffet
- मैं browser में कई ताकतवर AI models के मुफ़्त versions अलग-अलग tabs में खोलकर रखता हूँ
- यह एक ही model पर निर्भर रहने के बजाय, कई नज़रियों से जवाब पाने का तरीका है। जिन मुफ़्त model combinations का मैं सबसे ज़्यादा उपयोग करता हूँ, वे इस प्रकार हैं।
- GLM 4.5: web पर मुफ़्त उपलब्ध है, और अनुभव के हिसाब से Claude 4 स्तर या उससे बेहतर performance देता है। मैं हमेशा 2~3 tabs खोलकर रखता हूँ
- Kimi K2: Claude या Opus series जैसा model, जो web पर मुफ़्त उपलब्ध है। आमतौर पर 1~2 tabs खोलता हूँ, और GLM 4.5 आने से पहले यह दिन में कई बार मुश्किल bugs हल कर देता था
- Qwen3 Coder और नए models: अलग-अलग coding-focused models को test करने के लिए उपयोग करता हूँ
- OpenAI Playground: GPT-4.5, o3 जैसे कई models को मुफ़्त इस्तेमाल किया जा सकता है। अगर account data settings में "OpenAI can use data for model training" की अनुमति दें, तो मुफ़्त tokens मिलते हैं
- Google Gemini AI Studio: Gemini 2.5 Pro/Flash models को लगभग मुफ़्त और लगभग unlimited तरीके से इस्तेमाल किया जा सकता है। मैं आमतौर पर 1~3 tabs खोलकर रखता हूँ
- Google Gemini 2.5 Pro: यह AI Studio से अलग service है, और image generation तथा deep research features में बेहतर है। मैं इसे AI Studio के साथ parallel tabs में इस्तेमाल करता हूँ
- Poe.com: Claude 4 या o4-mini जैसे premium models के लिए daily free credits देता है
- OpenRouter: मुफ़्त और paid models का मिश्रित उपयोग संभव है। मैं कई models को अलग-अलग tabs में set करके रखता हूँ
- ChatGPT: इसका मुफ़्त version भी अभी काफ़ी उपयोगी है, इसलिए कम से कम 1 tab खुला रखता हूँ
- Perplexity AI: research-केंद्रित सवालों में मज़बूत
- Deepseek: v3 और r1 models मुफ़्त देता है। लेकिन context limits का ध्यान रखें
- Grok.com: सामान्य उपयोग, deep research और image editing के लिए unlimited free access देता है। खास तौर पर इसका deep research feature Perplexity जैसा उपयोगी है
- Phind: जवाबों के साथ flowcharts या diagrams देने की कोशिश करता है
- lmarena.ai: Claude Opus 4 और Sonnet 4 मुफ़्त देता है। Opus 4 का मुफ़्त उपयोग काफ़ी मूल्यवान है
Claude.ai खुद भी मुफ़्त है, लेकिन usage limits बार-बार आने से असुविधा हो सकती है, इसलिए Cody extension या Copilot जैसी दूसरी approaches का उपयोग किया जाता है।
> ध्यान देने योग्य बात – Grok का उपयोग करते समय
> Grok मुफ़्त compute और बिना censor की गई image generation देता है, इसलिए जब दूसरे models के safety systems बाधा बनते हैं, तब यह उपयोगी हो सकता है। हालांकि, ऐसी रिपोर्टें हैं कि इसके operators नाज़ी-संबंधित विचारों या misinformation को बढ़ावा देने की मंशा रख सकते हैं। खासकर यह दावा भी हुआ है कि इसे अफ्रीका में genocide जैसी ऐतिहासिक घटनाओं पर झूठी जानकारी देने के निर्देश दिए गए थे। ऐसी विकृतियाँ मुख्य रूप से X platform पर दिखाई देती हैं, लेकिन इसे coding जैसे सुरक्षित उपयोगों तक सीमित रखना या संभावित bias को ध्यान में रखकर इस्तेमाल करना बेहतर है।
A smarter, cheaper workflow: Focused Context
- web-based AI chat interfaces (AI Studio, ChatGPT, OpenRouter आदि) का उपयोग करते समय, कई बार वे IDE या agent frameworks (Cline, Trae, Copilot आदि) की तुलना में problem solving या solution suggestions में बेहतर साबित होते हैं
- अगर Cursor, Cline, Roo Code जैसे tools से हर काम कराया जाए, तो MCP server usage या file editing procedures जैसी बड़ी मात्रा में ऐसी text AI को भेजी जाती है जो समस्या से सीधे संबंधित नहीं होती, जिससे AI भ्रमित होता है और performance गिरती है
- इसी वजह से, सबसे महंगे models का उपयोग करने पर भी अनावश्यक जानकारी से पैदा होने वाले ‘slowdown effect’ को पार नहीं किया जा सकता
- इसलिए, मैं समस्या-समाधान के लिए ज़रूरी सटीक context खुद तैयार करके उसे web-based AI chat में paste करता हूँ और सवाल पूछता हूँ या code review माँगता हूँ
- जब solution मिल जाता है, तो उसी बात को Cline जैसे agents के लिए prompt के रूप में लिखकर उनसे सिर्फ़ file editing करवाता हूँ
- इस तरह GPT-4.1 (जिसका unlimited उपयोग संभव है) का इस्तेमाल करके कम लागत में problem solving और planning की जा सकती है, और बेवजह Claude credits खर्च करने की ज़रूरत नहीं पड़ती
- मुश्किल समस्या-समाधान के लिए Claude और execution के लिए web chat AI को साथ में इस्तेमाल करके efficiency बढ़ाई जाती है
-
How AI Code Prep Helps (Example Prompt Structure)
example prompt:
Can you help me figure out why my program does x instead of y?- AI Code Prep GUI project folder को recursively scan करता है, subfolders और files तक सब कुछ देखता है, फिर code और सवाल को AI के लिए आसान format में व्यवस्थित करता है
- generated context का उदाहरण:
Can you help me figure out why my program does x instead of y? fileName.js: <code> ... 파일 내용 ... </code> nextFile.py: <code> import example ... 기타 내용 ... </code> Can you help me figure out why my program does x instead of y?- सवाल को दो बार दोहराया जाता है (ऊपर/नीचे/दोनों तरफ़ चुन सकते हैं) ताकि AI focus बनाए रखे
- Windows में project folder के अंदर mouse right-click → "AI Code Prep GUI" चलाएँ → code files अपने-आप चुनी जाती हैं, और
node_modules,.gitजैसी अनावश्यक directories अपने-आप exclude हो जाती हैं - selection पूरी तरह सही न भी हो, तो checkbox के ज़रिए आसानी से समायोजित किया जा सकता है
- जब बड़े project के कारण AI context limit पार हो जाए, तब केवल ज़रूरी files चुनकर दी जा सकती हैं
-
यह तरीका क्यों महत्वपूर्ण है?
- Cline, GitHub Copilot, Cursor, Windsurf जैसे कई code agents context बहुत ज़्यादा या बहुत कम भेजते हैं, इसलिए वे inefficient हो जाते हैं
- files को खुद चुनने पर, बिना अनावश्यक data के सिर्फ़ ज़रूरी जानकारी AI को दी जा सकती है
- GUI-based होने की वजह से, यह CLI या public GitHub links माँगने वाले दूसरे context-generation tools की तुलना में private code security और convenience दोनों में बेहतर है
- latest feature updates के लिए wuu73.org/aicp देखें
Model Strategy: काम के लिए सही दिमाग चुनना
- कई शक्तिशाली AI मॉडल वेब इंटरफ़ेस के जरिए मुफ़्त में उपलब्ध हैं (AI Studio में Gemini, Grok, Deepseek आदि), इसलिए पहले इन्हें प्राथमिकता से उपयोग करें
- Poe.com Claude और नई o4 series जैसे टॉप-टियर मॉडल के लिए मुफ़्त daily credits देता है
- Gemini 2.5 Pro (AI Studio में उपलब्ध) debugging, planning और overall काम में बेहद शानदार है, इसलिए इसे अभी सबसे versatile मॉडल माना जा सकता है
- मुश्किल समस्याओं के लिए o4-mini (OpenRouter या Poe पर उपलब्ध) आज़माएँ
- API usage में इसकी लागत पुराने टॉप-टियर मॉडल (Claude 3.5/3.7/4) की तुलना में काफी कम है
- ऐसा अनुभव रहा है कि इसने ऐसे bug को तुरंत हल कर दिया जिसे सुलझाना कठिन था
- Claude 3.7 या 4 को Poe, API (OpenRouter), GitHub Copilot Chat आदि के जरिए एक्सेस किया जा सकता है
- कुछ मुफ़्त usage मिलता है, लेकिन बार-बार इस्तेमाल करने पर लागत का बोझ बढ़ सकता है
- 3.7/4 creative और explosive output ('Hunter S. Thompson' style) देते हैं, लेकिन actual coding को शांत स्वभाव वाले Claude 3.5 पर छोड़ना ज़्यादा efficient हो सकता है
-
OpenAI Playground के मुफ़्त tokens का उपयोग कैसे करें
- अगर OpenAI account में data sharing setting को enable किया जाए, तो हर दिन बड़ी मात्रा में मुफ़्त tokens इस्तेमाल किए जा सकते हैं
- OpenAI Playground → ऊपर दाईं ओर settings icon → बाएँ मेनू में Data Controls → Sharing में "Share inputs and outputs with OpenAI" को enable करने पर ये फायदे मिलते हैं:
- हर दिन अधिकतम 2.5 लाख tokens: gpt-5, gpt-4.1, gpt-4o, o1, o3
- हर दिन अधिकतम 25 लाख tokens: gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, codex-mini-latest
- इस setting का उपयोग करके o3 और GPT-4.5 जैसे टॉप-टियर मॉडल मुफ़्त में बड़ी मात्रा में इस्तेमाल किए जा सकते हैं
- OpenAI Playground में o3 और o4-mini को साथ-साथ चलाकर तुलना की जा सकती है, ताकि हर मॉडल की ताकत और उपयोग समझे जा सकें
-
सुझाई गई मॉडल-वार उपयोग रणनीति
- Gemini 2.5 Pro: debugging, planning और overall coding tasks में सर्वोच्च प्राथमिकता
- o4-mini: कठिन bug सुलझाने के लिए, बेहतरीन cost efficiency
- Claude 4 / 3.7: urgent और कठिन समस्याओं के समाधान के लिए सर्वोत्तम, लेकिन accessibility और cost सीमित
- Claude 3.5: 3.7/4 के creative outputs को refine करने या actual code लिखने के लिए उपयुक्त
- o3, GPT-4.5, Qwen3 Coder 480b, GLM 4.5: complex problems सुलझाने की क्षमता बहुत मजबूत, और मुफ़्त token settings के साथ बड़े पैमाने पर उपयोग संभव
The Hybrid Approach: Premium Planning + Budget Execution
- अलग-अलग मॉडल टेस्ट करने के बाद, quality और cost efficiency दोनों को अधिकतम करने वाली एक hybrid strategy विकसित की गई
- मुख्य insight यह है कि हर मॉडल development process के अलग-अलग चरणों में मजबूत होता है
> "Smart Juice" सिद्धांत – AI बेवकूफ़ क्यों हो जाता है
> मॉडल को मिलने वाली 'intelligence energy' सीमित होती है।
> अगर आप संक्षिप्त और focused prompt भेजते हैं, तो उस energy का लगभग 100% समस्या समाधान में उपयोग होता है।
> लेकिन अगर आप अनावश्यक रूप से जटिल input भेजते हैं (tool usage पर लंबा विवरण, समस्या से असंबंधित context, कई पेज का code आदि), तो उसका बड़ा हिस्सा इन्हें प्रोसेस करने में खर्च हो जाता है, जिससे असली समस्या सुलझाने के लिए उपलब्ध 'intelligence' कम हो जाती है।
>
> उदाहरण: Cursor, Cline जैसे IDE-integrated agents सवाल से पहले बहुत सारे निर्देश और context भेजते हैं, इसलिए मॉडल का focus कम हो जाता है।
> इसलिए अनावश्यक context घटाना और केवल समस्या समाधान के लिए ज़रूरी बातें भेजना सबसे बेहतर परिणाम पाने का तरीका है।
-
नया प्रोजेक्ट शुरू करते समय workflow
- 1. Plan & Brainstorm
- smart और मुफ़्त web models (Gemini 2.5, o4-mini, Claude 3.7/4, o3 आदि) से approach design करें, step-by-step plan बनाएँ, और ज़रूरी libraries पहचानें।
- 2. Generate Agent Prompt
- ऊपर दिए गए मॉडलों में से किसी एक से यह अनुरोध करें:
"Write a detailed-enough prompt for [Cline](https://cline.bot/), my AI coding agent, to complete the following tasks: [작업 설명]" - बने हुए prompt को ChatGPT जैसे rewriting में अच्छे मुफ़्त AI से एक बार और polish करें।
- ऊपर दिए गए मॉडलों में से किसी एक से यह अनुरोध करें:
- 3. Execute with Cline
- polished prompt को Cline में paste करें, और GPT 4.1 या Claude 3.5 (complex tasks के लिए Claude 4) के साथ चलाएँ।
- GPT 4.1 family निर्देशों का पालन करने की training में काफी अच्छी है।
- 4. Fallback
- अगर GPT 4.1 fail हो जाए, तो API के जरिए Claude 3.5 पर switch करें।
- Deepseek v3 या R1 भी instructions follow करने में बहुत मजबूत हैं।
- 1. Plan & Brainstorm
-
मुख्य रणनीति
- महंगे और smart मॉडल (या मुफ़्त में उपलब्ध Gemini 2.5 Pro) का उपयोग strategy और design चरणों के लिए करें।
- plan को 2~3 अलग मुफ़्त models (Deepseek R1, Poe का Claude आदि) में paste करके verify करें:
"Is this good? Can you improve it or find flaws?" - coding और execution चरण के लिए stable और efficient models (GPT 4.1, Claude 3.5) को Cline में इस्तेमाल करें।
-
मॉडल-वार उपयोग टिप्स
- o4-mini
- complex code logic की व्याख्या, framework·library selection जैसी high-level implementation strategy में मजबूत।
- idea brainstorming
- जब समाधान न मिले
- अगर मुफ़्त/कम-लागत मॉडल से समाधान न निकले, तो API के जरिए advanced और paid model पर escalation करें।
- o4-mini
Alternative Agents & Setups
- Trae.ai (Bytedance, TikTok की निर्माता)
- VS Code-संगत IDE, मुफ़्त AI उपयोग देता है: Claude 4, Claude 3.7, Claude 3.5, GPT 4.1 शामिल।
- बिल्ट-इन एजेंट का प्रदर्शन Cline से कम है (सच कहें तो Cline सबसे ताकतवर है)।
- यह VS Code क्लोन के रूप में है, इसलिए Cline एक्सटेंशन इंस्टॉल किया जा सकने की संभावना है।
- लेकिन सर्वर ओवरलोड की वजह से गति धीमी → मुफ़्त उपयोग की व्यावहारिकता कम।
- फिर भी मुफ़्त मॉडल एक्सेस होने के कारण इसका ज़िक्र किया गया है।
-
सुझाई गई 2 सेटिंग्स
- 1. VS Code + Cline + Copilot
- Copilot का $10/माह सब्सक्रिप्शन → Cline में कम लागत पर शक्तिशाली मॉडल API इस्तेमाल किए जा सकते हैं।
- मुफ़्त टियर में भी कुछ बुनियादी फीचर इस्तेमाल किए जा सकते हैं।
- 2. Trae.ai + Cline
- Trae की मुफ़्त मॉडल एक्सेस + Cline API key के संयुक्त उपयोग की संभावना की जाँच।
> टिप: Copilot का डिफ़ॉल्ट एजेंट कभी-कभी ऐसी समस्याएँ हल कर देता है जिन्हें Cline ठीक से नहीं कर पाता, और इसका उलटा भी होता है।
> Cline कभी-कभी बहुत लंबे prompts भेजता है जिससे प्रदर्शन गिर सकता है → ऐसे मामलों में Copilot बेहतर हो सकता है।
- Trae की मुफ़्त मॉडल एक्सेस + Cline API key के संयुक्त उपयोग की संभावना की जाँच।
- 1. VS Code + Cline + Copilot
-
Roo Code: Cline का क्लोन
- Roo Code लगभग Cline जैसा है, लेकिन कुछ अलग फीचर देता है।
- प्रोजेक्ट या कोडिंग स्टाइल के हिसाब से Roo Code बेहतर हो सकता है।
- Cline खुद मुफ़्त है, लेकिन API कॉल का शुल्क लगता है।
- सबसे किफ़ायती तरीका: VS Code LM API सेटिंग + Copilot का $10/माह सब्सक्रिप्शन → लगभग असीमित शक्तिशाली मॉडल उपयोग।
-
नए CLI टूल: Claude Code, Qwen Code, Gemini CLI
- हाल में CLI-आधारित कोडिंग टूल्स में रुचि तेज़ी से बढ़ी है।
- Claude Code: subagent सपोर्ट → एक समय में एक ही काम करता है, अतिरिक्त टूल्स का उपयोग नहीं करता।
- इस गाइड में बताए गए ‘स्मार्ट जूस’ केंद्रित workflow को फिर से बनाया जा सकता है।
- अनावश्यक agent निर्देशों (bloat) को हटाकर दक्षता बनाए रखता है।
- Qwen Code, Gemini CLI के भी अपने-अपने फ़ायदे हैं।
- Claude Code को GLM 4.5 के साथ इस्तेमाल करने की सेटअप गाइड z.ai साइट पर है।
- हर CLI टूल की अलग ताकत है, इसलिए गाइड और कम्युनिटी टिप्स देखकर प्रयोग करने की सलाह है।
TL;DR: Quickstart Guide
- Models & Roles
- Planning & Brainstorming
GLM 4.5, Kimi K2, नवीनतम Qwen3 Coder & 2507 सीरीज़, Gemini 2.5 Pro (AI Studio), o4-mini (OpenRouter), Claude 3.7/4 (Poe), OpenAI Playground में प्रतिदिन 250k मुफ़्त tokens (o3, GPT-5) के उपयोग की सिफ़ारिश - Problem Solving & Debugging
GPT-5 (Playground मुफ़्त tokens), GLM-4.5 (Claude 4 स्तर का प्रदर्शन), Claude 4 (Poe के मुफ़्त दैनिक tokens) - Actual Coding
GPT-4.1 (Cline), असफल होने पर Claude 3.5 विकल्प के रूप में, या Qwen3 Coder, Instruct, 2507, GLM 4.5, Kimi K2 का उपयोग
- Planning & Brainstorming
- Key Tools
- VS Code
- AI Code Prep GUI – लोकल में सिर्फ़ ज़रूरी फ़ाइलें स्कैन और चुनकर AI context को optimize करता है
- Cline (VS Code agent) – चरण-दर-चरण कोड निष्पादन
- मुफ़्त web chat – Poe.com, ChatGPT, Grok, Deepseek, Perplexity, OpenAI Playground, AI Studio (Gemini 2.5 Pro), OpenRouter, duck.ai
- Quick Workflow
- AI Code Prep GUI से प्रोजेक्ट-संबंधित फ़ाइलों को bundle करें
- उस context को अपने पसंदीदा web chat मॉडल में paste करके planning और debugging करें
- किसी एक मॉडल से
"इस काम के लिए विस्तृत Cline prompt लिखो"कहलवाएँ, फिर ChatGPT आदि में उसे refine करें - तैयार prompt को GPT-4.1 पर सेट किए गए Cline में paste करके कोड generate या modify करें
→ असफल होने पर Claude 3.5 पर स्विच करें
- Cost-Saving Hacks
- OpenAI Playground में “data sharing” सक्षम करें → प्रतिदिन 250k मुफ़्त tokens (GPT-4.5, o3) + प्रतिदिन 2.5M मुफ़्त tokens (o4-mini, o3-mini)
- GitHub Copilot का $10/माह सब्सक्रिप्शन → Cline में Claude models का सीमित उपयोग संभव
- OpenRouter pay-as-you-go → o4-mini, Claude 3.7 जैसे नए models कम लागत में उपयोग
Some Thoughts
- AI एक अद्भुत productivity amplifier है, लेकिन यह कोई जादुई छड़ी नहीं है।
- असली जादू तब होता है जब आपकी जिज्ञासा, दृढ़ता, और प्रयोग करने की इच्छा इन शक्तिशाली टूल्स के साथ मिलती है।
- bugs या समस्याओं से निराश मत हों — हर चुनौती कुछ नया सीखने का मौका है।
- मॉडल्स को मिलाकर इस्तेमाल करें, साहसी विचार आज़माएँ, और तोड़कर फिर से बनाने से मत डरें।
- सबसे अच्छे डेवलपर वे नहीं होते जो कभी अटकते नहीं, बल्कि वे होते हैं जो अटकने पर भी आगे बढ़ते रहते हैं और हर टूल और तकनीक का इस्तेमाल करते हैं।
- अव्यवस्था को अपनाइए, प्रक्रिया का आनंद लीजिए, और आपकी रचनात्मकता को रास्ता दिखाने दीजिए!
Latest Model Updates (Aug 2025)
💰 Budget-Conscious: Getting Max Value
-
GPT 4.5
- Status: बंद कर दिया गया
-
o3
- क्षमता: Claude 4 के बराबरी का प्रदर्शन, कठिन समस्याएँ हल करने में बेहतरीन, जीनियस-स्तर
- उपयोग टिप: AI Code Prep GUI से पूरा codebase डालकर विश्लेषण किया जा सकता है
- Free Tokens: Data Controls/Sharing settings में data sharing सक्षम करने पर 250k tokens/दिन
-
o4-mini
- क्षमता: o3 से थोड़ा कम, लेकिन बहुत शानदार प्रदर्शन, जैसे o3 का छोटा भाई मॉडल
- Free Tokens: data sharing सक्षम करने पर 2.5M tokens/दिन
-
Gemini 2.5 Pro
- उपयोग: AI Studio में मुफ़्त
- विशेषता: जटिल debugging, architecture design और planning
-
Deepseek R1 0528
- क्षमता: बेहतर reasoning performance वाला बेहद स्मार्ट मॉडल
- उपयोग: Deepseek web interface में मुफ़्त इस्तेमाल संभव
🚀 Premium: Fix Problems NOW
-
Claude 4 Sonnet
- क्षमता: पर्याप्त context देने पर ज़्यादातर समस्याएँ एक ही बार में हल कर देता है
- विशेषता: लेखन, problem solving आदि में कुल मिलाकर बेहतरीन प्रदर्शन
- उपयोग: जब पहली ही कोशिश में सही समाधान ज़रूरी हो
-
Claude 4 Opus
- कीमत: $75 / 1M tokens
- प्रदर्शन: Sonnet से भी बेहतर माने जाने वाला “magic sauce” स्तर का प्रदर्शन
- उपयोग: जब अंतिम स्तर की problem solving चाहिए
Solid Worker Models
निम्न मॉडल निर्देशों का अच्छी तरह पालन करते हैं और स्थिर रूप से काम पूरा करते हैं:
-
GPT 4.1
- एक top-tier smart मॉडल, जिसे डिज़ाइन और problem solving के बाद वास्तविक code edits के लिए उपयोग किया जा सकता है
- कहीं से भी मिला output सीधे Cline में पेस्ट करके चलाया जा सकता है
-
Claude Sonnet 3.5
- coding और editing में मजबूत
- 4.1 से थोड़ा धीमा, लेकिन बहुत स्थिर
-
Deepseek v3
- code लिखने, संशोधित करने और agent tasks के लिए उपयुक्त
- कीमत के मुकाबले प्रदर्शन बेहतरीन
-
OpenRouter Free Models
- OpenRouter पर price filter को
$0पर सेट करके free models खोजें - नए मॉडल आते ही उन पर प्रयोग करना फायदेमंद हो सकता है
- OpenRouter पर price filter को
Free Claude 4: lmarena.ai, and More
Claude Opus 4 and Sonnet 4
- lmarena.ai पर Claude Opus 4, Sonnet 4 आदि मुफ्त में उपलब्ध हैं
- टिप: Anthropic परिवार के मॉडलों को मुफ्त में इस्तेमाल करने के मौके ज़रूर सहेजें, याद रखें और उपयोग करें
- उपयोग: जब बाकी सब विफल हो जाए, या काम तुरंत और पूरी तरह सही तरीके से पूरा करना हो, तब Claude 4 Sonnet या Opus चुनें
NEW!! Bad ass new Chinese models + GPT 5
-
GLM 4.5
- प्रदर्शन: Claude 4 Opus या Sonnet के समान
- विशेषता: agent rules और tool usage को लगभग पूरी तरह सही ढंग से निभाता है
- उपयोग: बेहद कठिन bug fixes और बहुत अधिक context मांगने वाले जटिल कामों के लिए मजबूत
-
Qwen3 Coder 480B
- मूल्यांकन: शक्तिशाली और सस्ता, इसलिए काफी पसंद किया जाने वाला मॉडल
- उपयोग: high-performance, low-cost coding environments में coding tasks
-
Qwen3 Instruct & Thinking 2507
- प्रदर्शन: Qwen3 Coder जैसी स्थिरता और ताकत
- फायदा: भरोसेमंद और cost-effective
-
Kimi K2 (Moonshot)
- विशेषता: इसका स्वभाव ऐसा लगता है मानो इसे Anthropic-आधारित या Claude-जैसे synthetic data पर train किया गया हो
- मूल्यांकन: बहुत शानदार प्रदर्शन, और अक्सर इस्तेमाल किया जाने वाला मॉडल
-
GPT 5
- सीमाएँ: custom tools के उपयोग (MCP, Cline आदि) में इसकी बढ़त कम है
- सुझाया गया उपयोग:
1. GPT 5, GLM 4.5 जैसे बेहतरीन मॉडलों से planning और problem solving कराएँ
2. उसके बाद prompt लिखें ताकि कोई सरल agent मॉडल वास्तविक edits और tool usage संभाल सके - तुलना:
- GPT 4.1 अब भी cost-performance के हिसाब से बहुत अच्छा value देता है
- नए Chinese models custom tools/Cline usage में मजबूत हैं
- कुल मिलाकर: अभी इतना व्यापक प्रयोग नहीं किया गया है, लेकिन हर मॉडल की अपनी ताकत है, और फिलहाल कीमत व स्थिरता के लिहाज से Chinese models बहुत आकर्षक हैं
Current Coding Workflow (2025)
-
For New Projects:
- 1. Planning Phase:
- project की सारी details (language, libraries, server आदि) notepad में लिखें
- 2. Multi-Model Consultation:
- वही सामग्री कई मॉडलों में पेस्ट करके ‘कई विशेषज्ञों की राय’ लें:
- Gemini 2.5 Pro (मुफ्त)
- GPT 4.1
- o4-mini
- Claude 4 (Poe के free daily credits का उपयोग)
- वही सामग्री कई मॉडलों में पेस्ट करके ‘कई विशेषज्ञों की राय’ लें:
- 3. Refinement:
- मॉडल के साथ बार-बार बातचीत करके details को fine-tune करें
- 4. Task Generation:
- मॉडल से Cline AI coding agent के लिए step-by-step task list लिखने को कहें
- 5. Execution:
- Cline (या Roo Code) में GPT 4.1 को
actmode पर सेट करके काम चलाएँ
- Cline (या Roo Code) में GPT 4.1 को
- 1. Planning Phase:
-
For Problem Solving:
- जटिल codebase analysis: GPT 4.5 + AI Code Prep का उपयोग
- GPT 4.5 से कहें: “एक prompt लिखो ताकि Cline यह काम पूरा कर सके”
- समस्या की जटिलता के अनुसार मॉडल चुनें
- अलग-अलग मॉडलों का उपयोग करके कई कोणों से समाधान खोजें
-
Task List & Test Driven Development (Coming Soon)
Test Driven Development & Task Lists:- AI से Cline, Roo Code, Trae agent चलाने के लिए विस्तृत task list लिखने को कहें
- Cline या Roo Code को यह निर्देश दिया जा सकता है कि वे Markdown file में task progress लिखें और पूरा होने पर उसे check करें
- इससे progress को आसानी से track किया जा सकता है और कुछ छूटने से बचा जा सकता है
- फिलहाल, मॉडल से Markdown checklist बनवाकर, फिर Cline या Roo Code से उस file को update करवाने के तरीके पर प्रयोग किया जा सकता है
-
Money-Saving Hacks
- GPT 4.5 & o3: अगर model training data sharing चालू करें, तो रोज़ 250,000 tokens मुफ्त मिलते हैं
- सस्ते मॉडल: o4-mini, 4.1-mini/nano पर रोज़ 2.5 million tokens इस्तेमाल किए जा सकते हैं
- GitHub Copilot: $10 प्रति माह में नए Claude models का उपयोग संभव है (speed limit के साथ)
- Trae IDE: फिलहाल Claude 4 और GPT 4.1 मुफ्त में उपलब्ध हैं (subscription की जरूरत नहीं, और लगता है कोई सीमा भी नहीं है)
- Poe.com: सभी मॉडलों के लिए free daily credits देता है
- Web Interfaces: planning और consultation के लिए मुफ्त web chat interfaces का उपयोग करें
-
Coming Soon: Live Reddit Data & Insights
Live Reddit Data Scraping & Daily Insights:- Reddit data को real time में scrape करके, AI models के उपयोग के मामलों पर रोज़ अपडेटेड जानकारी देने की योजना है
- इसमें detailed usage analysis, data visualization, और वास्तविक coding workflows व trends पर नए insights शामिल होंगे
अभी कोई टिप्पणी नहीं है.