15 पॉइंट द्वारा GN⁺ 2026-04-22 | 9 टिप्पणियां | WhatsApp पर शेयर करें
  • Anthropic के एक प्रतिनिधि ने सूचित किया है कि OpenClaw शैली में Claude CLI का उपयोग फिर से अनुमत है
  • Anthropic API key और Claude CLI reuse दोनों का समर्थन किया जाता है, और मौजूदा Anthropic token profiles भी रनटाइम पर मान्य बने रहते हैं
  • Claude CLI backend को फिर से अनुमत integration method के रूप में संभाला जाएगा, और नई policy घोषित होने तक claude -p का उपयोग भी अनुमत रहेगा
  • Claude 4.6 मॉडल में जब explicit thinking setting न हो, तब डिफ़ॉल्ट रूप से adaptive thinking लागू होता है, और इसे /think:<level> या model parameter से override किया जा सकता है
  • /fast toggle केवल उन requests में service_tier inject करता है जो सीधे api.anthropic.com पर जाती हैं; proxy या gateway से होकर जाने पर tier change लागू नहीं होता
  • prompt caching और 1M context window का भी समर्थन है, लेकिन caching केवल API के लिए है और 1M context के लिए explicit activation तथा long-context usage की अनुमति चाहिए; मौजूदा sk-ant-oat-* auth में beta header शामिल नहीं किया जाता

Anthropic support methods

  • Claude model family तक पहुंच के लिए API और Claude CLI दोनों का समर्थन है, और OpenClaw में Anthropic API key तथा Claude CLI reuse दोनों का उपयोग किया जा सकता है
    • पहले से configured existing Anthropic token profiles भी execution के समय मान्य रहते हैं
  • Anthropic API key

    • standard API access और usage-based billing के लिए उपयुक्त मार्ग
    • API key को Anthropic Console में generate किया जा सकता है
    • CLI setup example में openclaw onboard पर Anthropic API key चुना जा सकता है
    • non-interactive तरीके से openclaw onboard --anthropic-api-key "$ANTHROPIC_API_KEY" समर्थित है
    • configuration snippet example में ANTHROPIC_API_KEY environment variable और default model anthropic/claude-opus-4-6 का उपयोग किया गया है

Thinking defaults

  • Claude 4.6 models में OpenClaw, explicit thinking level न होने पर डिफ़ॉल्ट रूप से adaptive thinking लागू करता है
  • इसे प्रति-message /think:<level> या model parameter agents.defaults.models["anthropic/<model>"].params.thinking से override किया जा सकता है
  • संबंधित documentation के रूप में Adaptive thinking और Extended thinking के links दिए गए हैं

Fast mode

  • OpenClaw का shared /fast toggle, api.anthropic.com पर भेजे जाने वाले direct public Anthropic traffic को भी support करता है
    • इसमें API key auth और OAuth-authenticated requests दोनों शामिल हैं
  • /fast on को service_tier: "auto" से map किया जाता है
  • /fast off को service_tier: "standard_only" से map किया जाता है
  • configuration default example में anthropic/claude-sonnet-4-6 model के लिए params.fastMode: true इस्तेमाल किया गया है
  • Limitations

    • OpenClaw केवल direct api.anthropic.com requests में Anthropic service tier inject करता है
    • यदि anthropic/* requests को proxy या gateway के माध्यम से route किया जाए, तो /fast service_tier नहीं बदलता
    • explicit serviceTier या service_tier model parameters, /fast defaults पर प्राथमिकता लेते हैं
    • Anthropic वास्तव में लागू tier को response के usage.service_tier में रिकॉर्ड करता है
    • जिन accounts में Priority Tier capacity नहीं है, उनमें service_tier: "auto" फिर भी standard के रूप में interpret हो सकता है

Prompt caching

  • OpenClaw, Anthropic की prompt caching capability को support करता है
  • यह feature API-only है, और मौजूदा Anthropic token auth cache settings को reflect नहीं करता
  • Configuration

    • model settings में cacheRetention parameter का उपयोग किया जाता है
    • none caching को disable करता है
    • short 5 मिनट cache रखता है
    • long 1 घंटे की extended cache देता है
    • configuration example में anthropic/claude-opus-4-6 model पर params.cacheRetention: "long" इस्तेमाल किया गया है
  • Defaults

    • Anthropic API key auth का उपयोग होने पर सभी Anthropic models पर cacheRetention: "short" अपने-आप लागू होता है
    • cacheRetention को explicitly set करके इस default को override किया जा सकता है
  • Per-agent overrides

    • model-level parameters baseline की तरह काम करते हैं, और specific agents agents.list[].params से individually override किए जा सकते हैं
    • example में research default setting का उपयोग करता है, जबकि alerts पर cacheRetention: "none" लागू है
    • cache-related parameter merge order agents.defaults.models["provider/model"].params के बाद agents.list[].params है
    • एक ही model का उपयोग करते हुए भी एक agent long cache रख सकता है और दूसरा agent cache disable कर सकता है
    • cache disable करने के use case के रूप में burst-like या low-reuse traffic में write cost से बचने का उल्लेख है
  • Bedrock Claude note

    • Bedrock के Anthropic Claude models amazon-bedrock/*anthropic.claude* configured होने पर cacheRetention pass-through को support करते हैं
    • non-Anthropic Bedrock models पर runtime में cacheRetention: "none" force किया जाता है
    • Anthropic API key आधारित smart defaults, explicit value न होने पर Claude-on-Bedrock model references पर भी cacheRetention: "short" लागू करते हैं

1M context window

  • Anthropic का 1M context window एक beta-restricted feature है, और OpenClaw में supported Opus/Sonnet models पर params.context1m: true से enable किया जा सकता है
  • configuration example में anthropic/claude-opus-4-6 model पर params.context1m: true उपयोग किया गया है
  • OpenClaw इसे Anthropic requests के anthropic-beta: context-1m-2025-08-07 header में map करता है
  • यह feature केवल तभी enable होता है जब उस model पर params.context1m को explicitly true set किया गया हो
  • उपयोग की शर्त यह है कि संबंधित credentials पर Anthropic ने long-context usage की अनुमति दी हो
  • वर्तमान में Anthropic, legacy Anthropic token auth sk-ant-oat-* के साथ context-1m-* beta requests को reject करता है
  • legacy auth mode में context1m: true set होने पर OpenClaw warning log छोड़ता है, context1m beta header को skip करता है, और standard context window पर fallback करता है
    • आवश्यक OAuth beta फिर भी बरकरार रहता है

Claude CLI backend

  • OpenClaw में bundled Anthropic claude-cli backend का समर्थन है
  • Anthropic के एक कर्मचारी ने बताया कि यह usage pattern फिर से अनुमत है
  • इसके अनुसार, Anthropic जब तक नई policy घोषित नहीं करता, OpenClaw Claude CLI reuse और claude -p usage को अनुमत integration method की तरह संभालेगा
  • हमेशा-on gateway host और explicit server-side billing control के लिए Anthropic API key सबसे स्पष्ट operational path है
  • setup और runtime details के लिए /gateway/cli-backends path देखें

Notes

  • Anthropic की public Claude Code documentation अभी भी claude -p जैसे direct CLI usage को document कर रही है
  • Anthropic के एक कर्मचारी ने बताया कि OpenClaw style Claude CLI usage फिर से अनुमत है, और Anthropic द्वारा नई policy change घोषित होने तक इसे confirmed guidance माना जाएगा
  • OpenClaw में Anthropic setup-token भी एक supported token auth path के रूप में उपलब्ध रहता है
  • हालांकि, जहां उपलब्ध हो, OpenClaw Claude CLI reuse और claude -p को अधिक प्राथमिकता देता है
  • auth details और reuse rules के लिए /concepts/oauth path देखें

Troubleshooting

  • 401 errors / token suddenly invalid

    • Anthropic token auth expire हो सकता है या revoke किया जा सकता है
    • नए setups के लिए Anthropic API key पर migrate करने की सिफारिश है
  • No API key found for provider “anthropic”

    • auth per-agent लागू होता है
    • नए agents main agent की key inherit नहीं करते
    • उस agent के लिए onboarding फिर से चलाएं, या gateway host पर API key set करके openclaw models status से verify करें
  • No credentials found for profile anthropic:default

    • कौन-सा auth profile active है, यह openclaw models status से देखा जा सकता है
    • onboarding दोबारा चलाएं या उस profile path में API key set करें
  • No available auth profile (all in cooldown/unavailable)

    • openclaw models status --json में auth.unusableProfiles देखा जा सकता है
    • Anthropic rate limit cooldown model-level हो सकता है, इसलिए भले ही मौजूदा model cooldown में हो, उसी family का दूसरा Anthropic model उपलब्ध हो सकता है
    • दूसरा Anthropic profile जोड़ें या cooldown खत्म होने का इंतज़ार करें
    • अतिरिक्त paths के रूप में /gateway/troubleshooting और /help/faq दिए गए हैं

9 टिप्पणियां

 
ceruns 2026-04-22

Codex के ज़रिए gemma4 31b लोकल मॉडल को codex में इस्तेमाल करने लायक बनाने के बाद (इतनी बारीकी कि मल्टी-टर्न तक खुद ही चेक करता है!) मैंने ChatGPT Pro के अलावा बाकी सभी सब्सक्रिप्शन बंद कर दिए। codex-app-linux और इन दोनों को साथ जोड़ने पर, जितना अधिकतम समानांतर काम मैं समझकर चला सकता हूँ, उसके बाद भी usage बचा रहता है।

 
woodev 2026-04-23

कृपया हार्डवेयर स्पेक्स के बारे में थोड़ा बताइए!

4090 पर चलाने पर यह काफ़ी स्मार्ट लगता है, लेकिन लंबे समय तक इस्तेमाल के लिए थोड़ा कमज़ोर लगा।

 
beoks 2026-04-22

मैं भी gemma4 को लोकल में चलाने की सोच रहा हूँ, क्या आप बता सकते हैं कि आपका हार्डवेयर स्पेक लगभग क्या है?

 
ingwannu 2026-04-22

सच कहूँ तो यह काफ़ी घटिया लग रहा है...
मुझे तो बस यही लग रहा है कि pro users को Claude Code इस्तेमाल नहीं करने देना चाहते थे, लेकिन लोगों की नाराज़गी बढ़ गई, इसलिए फिलहाल के लिए ऐसा कर रहे हैं..

 
jimmy2056 2026-04-22

फिर भी, बेवजह गलत इस्तेमाल करके अकाउंट सस्पेंड होने से बेहतर है कि अभी थोड़ा इंतज़ार करके देखा जाए।

 
hmmhmmhm 2026-04-22

CC OAuth API key के इस्तेमाल से काफ़ी सिरदर्द हुआ, फिर मैं बस अपने पुराने Codex पर ही आकर टिक गया...

 
xguru 2026-04-22

असल में मैं भी इन दिनों बस Codex पर ही टिक गया हूँ.. Claude में token की खपत बहुत तेज़ है

 
GN⁺ 2026-04-22
Hacker News की राय
  • मैं OpenClaw का Peter हूँ। Claude Code के Boris ने Twitter पर सार्वजनिक रूप से कहा था कि CLI-style usage allowed है, इसलिए मैंने उस गाइडेंस पर भरोसा करके implementation में निवेश किया। CLI usage के समय heartbeat जैसी ज़रूरत से ज़्यादा token features को default रूप से बंद करने के लिए भी बदलाव किया, लेकिन असल में Anthropic system prompt के कुछ हिस्सों को block कर रहा है, इसलिए public communication और मौजूदा behavior एक-दूसरे से मेल नहीं खाते। संबंधित बयान यहाँ देखा जा सकता है। लोगों ने नाम थोड़ा बदलकर bypass करना शुरू किया तो classifier भी बदला हुआ लगता है, लेकिन मेरा ऐसा bypass game खेलने का इरादा नहीं है, इसलिए हालत ऐसी हो गई है कि सिद्धांत में संभव है, पर व्यवहार में नहीं

    • OpenClaw के बाहर भी बहुत से लोगों ने उस Tweet पर भरोसा करके claude -p आधारित workflow काफ़ी गहराई तक बना लिए हैं। लेकिन नए --bare flag के आने के साथ ऐसा लग रहा है कि unlimited users के लिए -p को लगभग किनारे किया जा रहा है, यानी एक तरह का rug pull। docs में भी लिखा है कि --bare scripts और SDK calls के लिए recommended mode है, और आगे चलकर वही -p का default बनेगा। मैं उम्मीद करता हूँ कि मेरी समझ ग़लत हो, या फिर कम से कम साफ़ explanation मिले। docs हैं headless docs
    • जब बात allowed scope की चल ही रही है, तो OpenAI के Codex quota usage scope को लेकर भी जिज्ञासा है। मेरी समझ है कि OpenClaw में इसका उपयोग allowed है, लेकिन क्या users को दूसरे coding harnesses या paid apps के भीतर अपना Codex quota इस्तेमाल करने देना भी allowed है, इसका जवाब नहीं मिला। छोटे players के लिए token costs को subsidize करना मुश्किल होता है, इसलिए अगर ऐसी policy खुली हो तो use cases बहुत बढ़ सकते हैं। लेकिन subscription model की प्रकृति देखते हुए लगता है कि शायद इसे जानबूझकर धुंधला रखा गया है, और यही बात और निराश करती है
    • मेरी राय में OAuth token पर बस साधारण rate limit लगा देना काफ़ी है। सिद्धांत भी सीधा है: subscription इंसानों द्वारा समझ आने वाले human-scale usage के लिए हो, और API key बाकी automation के लिए। Anthropic को machine-like usage सीमित करना चाहिए, लेकिन लोगों को अपने OAuth token से claude -p या बेहतर SDK-based workflows बनाने देने चाहिए
    • Anthropic की स्थिति मुश्किल है, यह बात भी कुछ हद तक समझ आती है। उदाहरण के लिए सोचें कि Waymo कोई subsidy वाला subscription pricing चला रहा हो, और लोग इंसान के बिना कार को timer पर बुक करके उसे मूल इरादे से अलग तरीके से इस्तेमाल करने लगें। कभी-कभार उससे grocery मँगवाना ठीक लग सकता है, लेकिन रोज़ एक ही समय पर उसे एक ice cream लाने भेजना एक धुंधली सीमा पर आता है। समस्या यह है कि जैसे ही आप नियम स्पष्ट करते हैं, लोग उन्हीं शब्दों के आसपास घूमकर economics exploit करने लगते हैं। लेकिन इसका मतलब यह भी नहीं होना चाहिए कि normal users के लिए बनाया गया plan ही पूरी तरह हटा दिया जाए
    • अब लगता है कि वे दिशा सुधारने की कोशिश कर रहे हैं, लेकिन तब तक trust काफ़ी खो चुका है। और नई, पहले से कम limits को देखते हुए यह भी सवाल है कि OpenClaw में इसे जारी रखना अब भी क़ीमती है या नहीं
  • मुझे अभी की स्थिति सचमुच धुँधली कीचड़भरी गड़बड़ी जैसी लगती है। Anthropic को साफ़-साफ़ बताना चाहिए कि subscription होने पर क्या supported है और क्या नहीं, और तब तक users के लिए यह समझना मुश्किल है कि उन्हें product कैसे इस्तेमाल करना चाहिए। मैं अभी OpenClaw या ऐसे products इस्तेमाल भी नहीं करता, लेकिन कम से कम इतना तो जानना चाहता हूँ कि क्या allowed है और क्या नहीं, और अभी यह लगभग असंभव है

    • Anthropic को subscription से जो मिलता है, उसे जिस तरह वे हफ़्ते-दर-हफ़्ते बदलते दिख रहे हैं, उसे देखकर मेरा मन hobby-level license से ज़्यादा पैसे देने का नहीं करता। product शानदार हो सकता है, लेकिन ऐसा लगता है कि वह इस पर निर्भर करता है कि आप किस समय इस्तेमाल कर रहे हैं और कंपनी उस समय क्या सोच रही है। इसी वजह से यह कुछ सुकून देता है कि काफ़ी सारे open-weight models मौजूद हैं, जो खराब व्यवहार पर एक ऊपरी सीमा तय कर देते हैं
    • मैं Claude Code license के साथ ऐसा custom harness इस्तेमाल करना चाहता हूँ जिसे मैं बढ़ा सकूँ, या अपना खुद का harness जोड़ सकूँ, और यदि संभव हो तो token costs भी कम करना चाहता हूँ। मेरी राय में Anthropic को अगले model से token usage घटाने या operational costs कम करने का कोई मानक बनाना चाहिए। अगर throughput लगभग वैसा ही रहे, तो थोड़ा धीमा होना भी चलेगा, बशर्ते लागत घटे और मैं उसे अपने बनाए harness के साथ इस्तेमाल कर सकूँ
    • मेरी चिंता खराब communication और लगातार होने वाले statement reversals हैं। मेरे core workflows में से एक hook scripts का है, जो अलग-अलग tasks को कई models के बीच route करते हैं। लेकिन क्या आगे चलकर यह भी banned हो जाएगा, कोई नहीं जानता। Anthropic लगातार एक जैसी explanation नहीं दे पाता, इसलिए ecosystem में invest करना मुश्किल है
    • मुझे थोड़ी हैरानी होती है कि लोग इतने shocked क्यों हैं। Twitter API जैसी मिसालों में हम पहले भी देख चुके हैं कि APIs तब तक खुली रहती हैं जब तक वे कंपनी की तत्काल समस्या हल कर रही हों, लेकिन बाद में जब लोग जिन features का उपयोग कर रहे हैं उन्हें कंपनी खुद बना लेती है, तो competitive-client जैसे use cases बंद कर दिए जाते हैं
    • vibe coding के जवाब में vibe product जैसा शब्द सूझता है। आजकल चीज़ें इतनी तेज़ी से आती और गायब होती हैं कि पहले जैसी उम्मीद अब बहुत कम रह गई है
  • मेरे हिसाब से असली मुद्दा यह है कि Anthropic के कर्मचारी Twitter पर आपस में contradictory explanations दे रहे हैं, फिर corrections भी कर रहे हैं, जिससे और बड़ा confusion पैदा हो रहा है। आज कहते हैं कि OpenClaw-style Claude CLI usage ठीक है, और कल policy update के साथ वापस ले लिया जाए—यह डर बना रहता है। Claude Code को लेकर Anthropic ने खुद को भरोसेमंद साबित नहीं किया, और मानसिक शांति के लिए किसी दूसरे provider पर जाना बेहतर लगने लगा है

    • वह typo-जैसा typo, keep your insanity, मुझे तो उल्टा बहुत सटीक अभिव्यक्ति लगा और हँसी आ गई
    • समझ नहीं आता कि ऐसी घोषणाएँ बार-बार Twitter पर क्यों की जाती हैं। policy को किसी आधिकारिक blog announcement में प्रकाशित करना चाहिए, और यह भी बताना चाहिए कि alternative harnesses को कैसे काम करना चाहिए। मौजूदा तरीका सचमुच बहुत unprofessional लगता है
    • मुझे भी यह खबर देने का तरीका अजीब लगा। क्यों Anthropic नहीं, बल्कि OpenClaw यह बता रहा है, समझ नहीं आता, और जब तक Anthropic खुद न कहे, तब तक इसे मान लेना मुश्किल है
    • मेरी नज़र में Anthropic की सबसे ताज़ा announcement यह थी कि OpenClaw usage पर subscribed users से extra charges लिए जाएँगे, न कि यह कि उसे ban किया गया है। और कुछ दिनों बाद बदलाव का कारण भी शायद यही रहा हो कि पहले की तरह third-party harnesses में OAuth tokens के direct use को तुरंत block करने के बजाय, ऐसे usage और claude -p दोनों को extra billing में डाल दिया जाए। इसलिए मुझे यह page उस announcement के विरुद्ध नहीं लगता
    • provider बदलने की बात मुझे Uber One और Lyft Pink के बीच घूमते रहने के अपने अनुभव जैसी लगती है। हर बार customer service खराब होने पर मैंने switch किया, लेकिन अंत में निष्कर्ष यही निकला कि एक familiar devil चुनकर उसकी आदत डाल लेना बेहतर है। फ़िलहाल OpenClaw issue का असर कम होने और Hegseth-Altman DoD से जुड़ी असहजता की वजह से मैं Claude पर हूँ, लेकिन ईमानदारी से कहूँ तो Google, Anthropic, और OpenAI—तीनों में से कोई भी AI communication और customer handling में विशेष रूप से आदर्श नहीं लगता
  • यह बदलाव तो 2 हफ़्ते पहले ही एक commit में वापस आ गया था, और वह भी ठीक 3 दिन बाद, जब Anthropic ने OpenClaw के लिए additional usage की ज़रूरत बताई थी। ऐसे घटनाक्रम को देखकर इसे गंभीरता से लेना मुश्किल है, और यह भी अजीब है कि न कोई official statement है, न एक Tweet तक। दूसरा संदर्भ HN link में देखा जा सकता है

    • मुझे लगता है confusion की वजह यह है कि Claude Code credentials के इस्तेमाल के दो तरीके हैं। एक है OAuth credentials लेकर अपना self-built agent बनाना, और यह allowed नहीं है। दूसरा है official Claude Code session के भीतर agent app को सीधे चलाना, और यह allowed है। OpenClaw जिस Open-Claw style CLI usage की बात कर रहा है, वह दूसरे वाले अर्थ के ज़्यादा करीब है। और अगर Claude Code CLI के बाहर OAuth credentials इस्तेमाल किए जाएँ, तो मेरी समझ में existing subscription के ऊपर API pricing के हिसाब से extra billing लगती है
    • मुझे भी यह हालिया Anthropic announcement के साथ कुल मिलाकर consistent लगता है। यहाँ कहीं भी यह नहीं लिखा कि extra billing नहीं होगी। असल बात ban नहीं, बल्कि यह interpretation है कि third-party harnesses में OAuth token के direct use और claude -p usage—दोनों को अब extra billing bucket में डाला जा रहा है
    • यह कहना कि न official announcement है न Tweet—इस पर आधा मज़ाक, आधा गंभीर जवाब यही है कि आजकल release notes और announcements शायद agentic anti-pattern माने जाते हैं। हालत यह है कि ऐसा लगता है जैसे अगर आप इन चीज़ों का ध्यान रखते हैं, तो शायद आप agentic ठीक से नहीं कर रहे
    • मुझे यह प्रतिक्रिया कुछ हद तक typical FUD amplification जैसी भी लगती है। negative interpretation को बहुत बढ़ा दिया जाता है, और positive signals दब जाते हैं
  • Anthropic ऐसा दिख रहा है मानो वह कीमतें बढ़ाकर, limits घटाकर, और policy को अस्पष्ट रखकर अपने बनाए हुए goodwill को जला देना चाहता हो

    • ऐसे बदलाव मुझे boiling frog जैसी तकनीक लगते हैं, जहाँ तापमान धीरे-धीरे बढ़ाया जाता है
    • उल्टा देखें तो अगर LLM services को लंबे समय तक चलना है, तो providers को hosting cost से ज़्यादा कमाना ही होगा। लेकिन मेरी राय में हम अभी भी उस बिंदु से काफ़ी दूर हैं
    • ऐसे समय में अपने-आप एक व्यंग्य निकलता है कि ज़रा shareholders के बारे में भी सोचो
    • कभी-कभी तो लगता है कि Anthropic हमें उन Chinese clones की तरफ़ धकेल रहा है जिन्हें वह bad actors मानता है
    • दूसरी तरफ़ यह भी हो सकता है कि कंपनी वही कर रही हो जो Hacker News हमेशा sustainability को लेकर कहता आया है। AI उपयोगी है, लेकिन sustainability अनिश्चित है—और अब जब कीमतें बढ़ रही हैं और tokens घट रहे हैं, तो सब नाराज़ हैं। इसमें एक तरह की विडंबना है
  • लगता है कि Amazon के साथ deal के तुरंत बाद होने की वजह से यह भी आख़िरकार compute constraints का मामला रहा होगा। वैसे भी, जो Codex $20/month plan मैंने इस्तेमाल किया, उसमें limits इतनी कम थीं कि agent किसी दूसरे agent तक handoff होने से पहले कुछ ढंग का कर ही नहीं पाता था। Anthropic की आधिकारिक announcement के बिना इस तरह इस्तेमाल करते हुए अपना प्यारा Max $200/month account खो देने का डर है, इसलिए कुछ समय तक मैं सावधानी से देखता रहूँगा

    • मेरा अनुभव काफ़ी अलग था। मैंने Claude web और Opus 4.7 से शुरुआत की, फिर Claude Code से उसे आगे बढ़ाया, और सिर्फ़ 6 से 10 prompts में quota के दो पूरे cycles खत्म हो गए। दूसरी ओर pi.dev और codex के साथ मैं कई घंटों तक काम करता रहा और Codex Pro subscription का लगभग 50 प्रतिशत ही इस्तेमाल हुआ। इसलिए मुझे consumption pattern का फ़र्क काफ़ी बड़ा लगा
    • अगर bulk usage चाहिए, तो Z.ai पर भी विचार किया जा सकता है। GLM अब काफ़ी अच्छा हो गया है, और बीच-बीच में API instability रहती है, लेकिन पहले मैं GLM को primary रखता था और Claude Pro सिर्फ़ review और summarization के लिए इस्तेमाल करता था; अब तो मैं सिर्फ़ GLM ही इस्तेमाल करता हूँ। Claude Max भी value के लिहाज़ से पूरी तरह बुरा नहीं है, लेकिन मेरे लिए उसकी ज़रूरत नहीं, और Anthropic के लिए मेरा लगाव भी धीरे-धीरे कम हो रहा है
    • मुझे याद है कि Anthropic ने शुरू से कहा था कि यह compute constraint की समस्या है, और OpenClaw उससे कहीं ज़्यादा usage पैदा करता है जितना वे संभाल सकते हैं
    • GPT-5.4 सचमुच token-guzzling लगता है। भले वह कम बोलता हो, लेकिन gpt-5.3 codex coding और planning दोनों में बहुत smart था, और tokens भी काफ़ी कम खाता था
  • मेरी समझ से, जब तक आप Anthropic की libraries या tools इस्तेमाल कर रहे हैं, तब तक OAuth credentials का उपयोग कर सकते हैं। उदाहरण के लिए, Claude Agent SDK में OAuth जोड़कर आप predictable monthly cost के भीतर Claude Code-embedded तरह-तरह के agents prototype कर सकते हैं, और skills को standalone tools या apps में बदलने के लिए यह खासा आकर्षक है। थोड़ा और advanced रूप में, आप tmux के अंदर Claude Code चलाकर उससे input-output भी करा सकते हैं, और MCP Channels भी दिलचस्प हैं, क्योंकि वे app और चल रहे Claude Code instance के बीच एक MCP server रखकर two-way communication संभव बनाते हैं। यह धीमा है, लेकिन दिलचस्प इसलिए है कि CLI session का context खोए बिना GUI किसी आसान task के लिए थोड़ी देर बाहर जाकर फिर लौट सकता है

    • सच तो यह है कि Claude Code CLI के लिए tmux ज़रूरी नहीं है। CLI खुद streaming JSON input और output support करता है, इसलिए उसे stdin और stdout pipes से control किया जा सकता है। मैं अभी ask में यही तरीका इस्तेमाल कर रहा हूँ, और यह काफ़ी अच्छा काम कर रहा है
  • पिछले एक हफ़्ते में मेरा OpenClaw side assistant, Claude इस्तेमाल करते हुए, अपनी व्यक्तित्व जैसी पहचान खो बैठा और वे काम भी नहीं कर पा रहा था जो पहले अच्छे से करता था। usage लगभग $28 तक गया, लेकिन उसके बाद आगे spend ही नहीं हुआ, इसलिए पता नहीं कोई और समस्या थी या नहीं, मगर behavior वैसा ही रहा। आख़िरकार मैं तंग आ गया और migration script से conversation history और personality को claude code config में ले गया। नए remote exec feature की वजह से OpenClaw जैसे cutting-edge experimental tools की instability झेले बिना मैं पुरानी ज़्यादातर functionality वापस पा सका। मुझे तो यह Anthropic की ऐसी योजना लगती है जिसमें hobby-user space में काफ़ी friction डालकर लोगों को अपने dedicated solution की ओर धकेला जाए, और किसी भी हाल में वह रास्ता ज़्यादा सुरक्षित लगता है

    • मेरी समझ में OpenClaw के ban होने की वजह system पर पड़ने वाला load था। third-party tools पहले भी technically illegal थे और अब भी सख़्ती से देखें तो हैं, लेकिन अब वे extra usage billing के साथ एक धुंधले tolerated state में दिखते हैं। लेकिन यहाँ कोई ख़ास relevance न रखने वाले 50,000-character proprietary system prompt जोड़ देने से स्थिति बेहतर होगी, ऐसा नहीं लगता। आख़िर में सवाल यही है कि अगर कोई claude -p prompt और cron से OpenClaw को दोबारा बना दे, तो क्या Anthropic उसे ख़ुशी से देखेगा? शायद नहीं। या शायद ऐसे लोग इतने कम होंगे कि वह इसे error margin मानकर नज़रअंदाज़ कर दे। संदर्भ के लिए यह HN post भी देख सकते हैं
    • अगर तुम्हारे और user के बीच का middleman किसी competitor द्वारा acquired हो जाए, तो उस dependency को कम करने की कोशिश करना स्वाभाविक है। यह कुछ वैसा अजीब है जैसे Apple, Microsoft stores में iPhone बेचे
    • Claude Code-आधारित तुम्हारा OpenClaw implementation असल में कैसा दिखता है, इसकी ठोस configuration जानने की जिज्ञासा है
  • OpenClaw यह कह रहा है कि Anthropic ने कहा था कि यह ठीक है—सचमुच क्या ही crystal clear स्थिति है, यह तंज अपने-आप निकल आता है

  • कुल मिलाकर मैं Claude Code, Opus, और Max plan के combination से संतुष्ट हूँ, लेकिन कभी-कभार failures, cost, और account ban के डर जैसी बातें अभी भी परेशान करती हैं। इसलिए जानना चाहता हूँ कि क्या कोई alternative stack है जो इसी तरह या इससे बेहतर अनुभव कम कीमत में दे सके। pi.dev और OpenCode की काफ़ी तारीफ़ सुनी है, और OpenCode के साथ Mimo V2 pro जोड़कर देखा तो काफ़ी अच्छा लगा। पहले, free access बंद होने से पहले, Qwen CLI और Gemini CLI भी इस्तेमाल किए थे, और Z.ai को OpenCode के साथ भी चलाया है। कुछ लोग यह भी कहते हैं कि planning के लिए Opus रखें और कम अहम काम सस्ते models को दे दें, लेकिन मुझे usage-based billing आख़िरकार सस्ती नहीं लगती, इसलिए मैं उसे पसंद नहीं करता। मैं ज़्यादातर Python backend और TypeScript frontend पर काम करता हूँ, Hetzner पर host करता हूँ, Docker बहुत इस्तेमाल करता हूँ और ज़रूरत पड़ने पर k3s भी—ऐसे environment में काम आने वाली कोई practical setup share हो तो अच्छा लगेगा

 
ajh508 2026-04-22

अगर prompt caching नहीं हुआ, तो लगता है tokens बस ऐसे ही खर्च हो जाएंगे।