1 पॉइंट द्वारा GN⁺ 5 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • ZCode एक आधिकारिक GLM-5.2 harness है, जिसका उद्देश्य development tools और AI agents को जोड़कर planning, coding, review और deployment को एक ही flow में संभालना है
  • ZCode 3.0 GLM-5.2 optimization और multi-agent collaboration में सुधार पर ज़ोर देता है, और reasoning व coding tasks के पूरे दायरे में GLM integration को प्रमुखता देता है
  • उदाहरण task में browser-based Gomoku AI game को नया बनाना शामिल है, और index.html, app.js, styles.css बनाने के बाद node --check app.js validation भी pass होता है
  • pricing plans के रूप में Lite $16.2/माह, Pro $64.8/माह, Max $144/माह दिए गए हैं, और अंतिम कीमत व benefits z.ai पर देखकर पुष्टि करनी चाहिए
  • macOS, Windows, Linux के लिए installer files उपलब्ध हैं, और Linux को Beta के रूप में दिखाया गया है, जिसमें x64·ARM64 .deb और AppImage शामिल हैं

GLM-5.2 के लिए तैयार development harness

  • ZCode एक ऐसा tool है जो AI agents और मौजूदा development tools को जोड़कर planning, coding, review और deployment को अधिक seamless तरीके से आगे बढ़ाने में मदद करता है
  • product positioning “Simple, Fast, Vibe‑Ready” है, और इसे GLM-5.2 के आधिकारिक harness के रूप में पेश किया गया है
  • ZCode 3.0 को GLM-5.2 के लिए optimize किया गया है, और multi-agent collaboration में सुधार को प्रमुख बदलाव के रूप में सामने रखा गया है

workflow उदाहरण

  • example task list में gomoku-ai, zcode-website, zcode-desktop, release-bot शामिल हैं
  • gomoku-ai एक intelligent Gomoku, यानी ओमोक game, बनाने का task है
    • player smart algorithm के खिलाफ खेलता है
    • लक्ष्य strategic moves खेलना और जीत की condition को सटीक रूप से detect करना है
  • task log के अनुसार मौजूदा repository खाली या लगभग खाली थी, इसलिए app को scratch से बनाने वाला flow अपनाया गया
    • git status --short चलाने पर यह error मिला कि current directory Git repository नहीं है
    • इसके बाद index.html, app.js, styles.css files लिखी गईं

Gomoku implementation का परिणाम

  • पूरा example एक standalone browser Gomoku game है
    • 15×15 board render करता है
    • player काले stones रख सकता है
    • चार दिशाओं में जीत detect करता है
    • winning line को highlight करता है
    • turn और move count को track करता है
    • game restart को support करता है
  • AI random नहीं बल्कि heuristic approach से moves चुनता है
    • आसपास के candidate moves खोजता है
    • अपने लिए फायदेमंद attack patterns को score करता है
    • player के threat को रोकने वाले defensive moves को score करता है
    • center preference जोड़ता है
    • सबसे मजबूत move चुनता है
  • वैकल्पिक रूप से AI focus area overlay चालू करके वे मजबूत candidate points देखे जा सकते हैं जिन्हें AI ने consider किया
  • validation चरण में node --check app.js pass हुआ
  • interactive browser execution नहीं की गई, और बाकी चरण index.html को browser में खोलकर खेलना है

long-running tasks और external control

  • ZCode लंबे समय तक चलने वाले tasks के लिए Goals feature देता है
    • यह complex tasks में लगातार planning, execution और validation को manage करता है
  • Bot control feature से WeChat, Feishu, Telegram में ZCode को शुरू और adjust किया जा सकता है
  • GLM-5.2 के साथ इसका integration reasoning, coding और multi-agent collaboration के पूरे दायरे में optimize किया गया है

pricing और downloads

  • GLM Coding Plan में तीन pricing plans दिए गए हैं
    • Lite: हल्के tasks के लिए, $16.2/माह, base usage शामिल
    • Pro: professional tasks के लिए, $64.8/माह, Lite का 5 गुना usage शामिल
    • Max: high-usage tasks के लिए, $144/माह, Lite का 20 गुना usage शामिल
  • कीमतें और plan benefits बदल सकते हैं, और अंतिम details z.ai पर देखनी चाहिए
  • All Downloads platform-wise installer files देता है
    • macOS: Apple Silicon .dmg v3.2.2, Intel .dmg v3.2.2
    • Windows: 64-bit .exe v3.2.2, ARM64 .exe v3.2.2
    • Linux: Beta के रूप में दिखाए गए x64 .deb, x64 AppImage, ARM64 .deb, ARM64 AppImage v3.2.2

1 टिप्पणियां

 
GN⁺ 5 시간 전
Hacker News टिप्पणियां
  • यह देखकर थोड़ा हैरान हुआ कि शायद यह open source नहीं है। Mimo Code https://github.com/XiaomiMiMo/MiMo-Code से तुलना होती है। फर्क यह है कि Mimo CLI है और यह desktop app है

    • समझ नहीं आता कि desktop app से करना क्या है। ऐसी चीज़ें headless VM में चलाता हूं, और जरूरत पड़े तो --dangerously-skip-permissions जैसे options भी लगा सकता हूं। उस flag के बिना भी मैं इसे अपने desktop/laptop पर भरोसेमंद नहीं मानूंगा
    • यह CLI इसलिए है क्योंकि opencode desktop code निकाल दिया गया है। opencode के Go/Zen model provider भी साथ में हट गए हैं
      मेरा अनुमान है कि इन्होंने काफी string replacement करके जल्दी से इसे first-party provider जैसा दिखाने की कोशिश की। फिर भी opencode को generic provider के तौर पर फिर से जोड़ा जा सकता था
    • यह हैरानी की बात नहीं लगती। harness base model जितना ही अहम होता जा रहा है। ऐसे उदाहरण भी हैं जहां सिर्फ harness से benchmark results लगभग 2x बेहतर हुए
      मेरे हिसाब से harness तेजी से “model” का ही core component बनता जा रहा है। अगर किसी कंपनी को revenue opportunity दिखती है और वह harness को closed-source रखती है, तो इसमें बिल्कुल अजीब बात नहीं
    • हो सकता है वे कुछ user requests Anthropic को भेजकर अपने model के लिए transaction data इकट्ठा कर रहे हों। अगर ऐसा है, तो उन्हें ऐसा request tracker लगाना पड़ सकता है जिसे वे छिपाना चाहेंगे
    • Anthropic Claude distillation को लेकर कड़ी चिंता जता रहा है, और अगर harness को moat मानने का विचार भी है, तो दूसरी तरफ वाले भी यह छिपाना चाहेंगे कि वे कितना अच्छा कर रहे हैं और उनका approach क्या है—यह ज्यादा चौंकाने वाला नहीं
  • Z.ai ने लगभग सभी लोकप्रिय CLI-based agents के साथ integrations document कर रखे हैं: https://docs.z.ai/devpack/tool/others
    अगर आप पहले से terminal UI coding agents के आदी हैं, तो desktop agent की जरूरत नहीं है। फिर भी जिन लोगों को Codex App/Claude App UI वाला तरीका पसंद है, उनके लिए यह होना अच्छा है

    • यहां lure शायद ज्यादा tokens का है। मुझे याद है कि अपना harness इस्तेमाल करने पर limits ज्यादा generous थीं
    • मैं GLM 5.2 को OpenCode में इस्तेमाल कर रहा हूं, और Docker container के अंदर CodeNomad को web-based GUI के रूप में जोड़कर चला रहा हूं। कहीं से भी access हो जाता है, और Anthropic subscription model को छोड़कर सभी models अच्छे से चलते हैं
    • Z.ai team ने पहले दिन से Linux support शामिल किया, यह तारीफ के काबिल है
  • काफी सुंदर लगता है। OpenCode की जगह इसे इस्तेमाल करना चाहूंगा या नहीं, पक्का नहीं। OpenCode का भी desktop app है, और निजी तौर पर मुझे उसका terminal UI ज्यादा पसंद है। सच कहूं तो Claude Code terminal UI से भी बेहतर लगता है। Desktop version ज्यादा basic है, लेकिन काफी ठीक है: https://opencode.ai/download
    हालांकि ZCode, OCR.z.ai, Image.z.ai, Audio.z.ai, AutoClaw आदि https://chat.z.ai/ से linked चीज़ें एक साथ इतनी ज्यादा रिलीज़ करना दिलचस्प है। एक organization के लिए यह काफी बड़ा volume है
    Pro coding plan भी आजमाया, लेकिन किसी खास task को पूरा करने के लिए जितने tokens चाहिए होते हैं, उसे देखते हुए quota Opus से बहुत ज्यादा नहीं लगता। फिर भी GLM 5.2 खुद एक ज्यादा मजबूत Sonnet जैसा model है और काफी ठीक है

    • उनका terminal UI Claude Code की तुलना में काफी भारी है और अक्सर crash होता है
  • यह देखना दिलचस्प है कि कंपनियां “base usage included” [1] या “standard limits” [2] जैसे phrases इस्तेमाल करके निकल जाती हैं, और higher plans को उस “base” के multiples के रूप में stack करती हैं, लेकिन असल base value क्या है यह disclose नहीं करतीं
    लगता है base value इस महीने के profit margin के हिसाब से तय होती है
    [1]: https://zcode.z.ai/en#:~:text=Base%20usage%20allowance%20inc...
    [2]: https://support.google.com/gemini/answer/16275805?hl=en#:~:t...

    • app चलाने पर actual base usage बता देता है। हालांकि plan names webpage से अलग हैं
      Start plan: रोज़ 5 million tokens (GLM-5.2 3 million, GLM-5 Turbo 2 million)
      For individuals: quota +150%, $18.00 USD+, individual developers के लिए dedicated Coding Plan quota
    • यह सच में काफी खराब है। हम जितना हो सके transparent रहने की कोशिश में इसे यहां डालते हैं: https://synthetic.new/rate-limits
    • इसलिए ऑस्ट्रेलिया की ACCC अच्छी है। अगर यह Australian company होती, तो इसे इस तरह निकलने नहीं देती
    • यह strategy उल्टा असर कर सकती है। unpredictable tool खराब tool से भी बुरा होता है
  • GPT-5.5/Codex रोज़ इस्तेमाल करने वाले व्यक्ति के तौर पर, मैं जानना चाहता हूं कि agentic coding के लिए पहले से set up codebase में GLM-5.2/ZCode की तुलना कैसी है

    • GLM 5.2 एक awkward valley में है। घर पर चलाने के लिए बहुत बड़ा है, और समान performance वाले models की तुलना में महंगा और धीमा है। अच्छा chart यहां है: https://deepswe.datacurve.ai/
      यह सिर्फ API pricing की तुलना है। Anthropic और OpenAI के subscription products शामिल करें तो comparison ही नहीं बनता। Codex $200 subscription में GPT 5.5 high/xhigh पर हफ्ते में 1 billion tokens भी आसानी से इस्तेमाल किए जा सकते हैं
      सबसे अच्छा performing open-weight model होने के नजरिए से यह दिलचस्प है, लेकिन अभी market में इसकी कोई पक्की जगह नहीं दिखती
    • संक्षेप में, GLM काम को काफी ज्यादा समय लगवाएगा, और complexity के हिसाब से tokens भी ज्यादा इस्तेमाल कर सकता है
      फिर भी यह काफी सस्ता है, इसलिए मेरे लिए इस्तेमाल लायक है। Claude का experience मुझे ज्यादा है, लेकिन मैं इसे Opus 4.1 के लगभग बराबर मानता हूं
  • UI के नजरिये से यह Claude Code की तुलना में Codex के कहीं ज्यादा करीब दिखता है। असल में यह Codex की सटीक कॉपी है

    • मैं पूरी तरह सहमत हूं। हाथ वाला आइकन, text field इस्तेमाल करने का तरीका, sidebar style भी Codex से 1:1 बिल्कुल वही है। शीर्षक गलतफहमी पैदा करता है। यह Claude Code के करीब नहीं है
    • इसलिए Codex को closed-source रखे रहना और भी हास्यास्पद लगता है। Software अब किसी की moat नहीं रहा। उसे वैसे ही छोड़ देना ठीक है
  • सोच रहा हूं कि क्या कोई development work के लिए ऐसा provider-neutral terminal UI या harness इस्तेमाल कर रहा है, जिसमें provider लगभग seamless तरीके से बदले जा सकें
    मुझे ऐसा local context चाहिए: “यहां 3 AI providers हैं, coding work के लिए इसे इस्तेमाल करो, prose writing के लिए इसे, और image generation के लिए इसे”

    • https://opencode.ai/
      OpenCode पहला agent harness था जिसे मैंने इस्तेमाल किया, और यह मुझे लगातार पसंद आया। इसमें अलग-अलग providers configure किए जा सकते हैं, यह open source है और इसके कई core contributors भी हैं
      एक और विकल्प Pi (Pi agent harness) है। lightweight option के रूप में यह शानदार है और कई providers को support करता है। local model server भी इस्तेमाल किया जा सकता है
    • पिछले 6 महीनों से मैं Pi और OpenCode दोनों इस्तेमाल कर रहा हूं, और इसी दौरान proprietary harnesses Claude Code, Codex, Cursor को कभी खोला भी नहीं। अभी मैं Pi इस्तेमाल कर रहा हूं, और session के बीच में ही अपने मनचाहे provider के किसी भी model पर seamlessly switch कर सकता हूं। इसे local में चल रहे model की ओर point भी कराया जा सकता है
      लगता है लोगों को अंदाजा नहीं है कि यह तरीका कितना ज्यादा सुविधाजनक है। मेरे हिसाब से Claude Code और Codex पूरी तरह vendor lock-in पर निर्भर हैं
    • मेरे बनाए model router role-model से यह संभव है। यह role, task आदि के आधार पर routing करता है। Pi के लिए इसका extension है, ताकि coding agent role, capability जैसे request metadata specify कर सके
      https://github.com/try-works/role-model
    • अगर अभी तक नहीं आजमाया है तो https://pi.dev एक बार try करने लायक है
      कई महीनों से मैं सिर्फ Pi ही इस्तेमाल कर रहा हूं और उसे extend भी कर रहा हूं: https://a.l3x.in/ai. मुख्य रूप से GLM-4.7, फिर 5.1, और अब 5.2 इस्तेमाल करता हूं, और लगभग कुछ और चाहने को बचता नहीं
      अभी “Github/Forgejo first” आधारित workflow को refine कर रहा हूं, लेकिन पहले से ही काफी संतुष्ट हूं। ज्यादातर sessions CI/CD job के रूप में चलते हैं, "/pi" comment से trigger होते हैं और PR बनाते हैं या PR में commits push करते हैं: https://github.com/shaftoe/pi-coding-agent-action
    • मैंने Codex और Claude Code के लिए एक skill लिखी है। इसका तरीका यह है कि main working tree में orchestrator तय किया जाता है, और N auxiliary working trees में किस तरह का भी AI worker हो, उससे फर्क नहीं पड़ता
      orchestrator जानता है कि हर working tree में कौन-सा AI client चल रहा है, इसलिए कौन-सा काम किस AI को भेजना है यह तय करना काफी आसान है
      हर working tree tab में Claude या Codex चलाता हूं। हर AI terminal UI के लिए कुछ अलग instructions भी हैं; जैसे Codex में Claude Code की तुलना में monitoring बहुत primitive है, इसलिए Codex worker के लिए नई “mail” को ठीक से watch करने का तरीका अलग से लिख रखा है
      main working tree के orchestrator के साथ काम करते हुए, orchestrator workers को tasks delegate करता है और छोटे सवालों के जवाब दिलवाता है। वह results ऊपर लाता है और जरूरत पड़ने पर context cleanup में भी मदद करता है
      orchestrator और workers tmp/* के नीचे एक simple shared file system से communicate करते हैं, और साथ मिलकर बड़े और विविध workload को संभाल सकते हैं
      मैं iTerm2 इस्तेमाल करता हूं, इसलिए मैंने iTerm2-specific Python भी जोड़ा है, जिससे orchestrator input modify करके submit कर worker को “जगा” सके या terminal UI द्वारा रोके गए काम (/clear आदि) करा सके
  • सस्ते tokens देने वाले चीनी open-weight models मुझे पसंद हैं, लेकिन उन्हें सिर्फ personal projects में इस्तेमाल करता हूं
    चीन का intellectual property और trade secrets चुराने का इतिहास रहा है, और चीनी courts ने अपनी घरेलू कंपनियों को तरजीह दी है। इसके उलट अमेरिका में मजबूत courts हैं जो intellectual property rights enforce कर सकती हैं। अगर आप कुछ सस्ते tokens के लिए अपनी company की intellectual property, trade secrets और data को जोखिम में डालना चाहते हैं, तो Z.ai services इस्तेमाल कर सकते हैं

    • ध्यान रहे कि Z.AI models को चीन के बाहर की infrastructure पर भी इस्तेमाल किया जा सकता है
    • अमेरिका भी ऐसा ही है
  • models और tools का अलगाव उतना ही महत्वपूर्ण है जितना legislature और judiciary का अलगाव। जो tools या harnesses सचमुच open source नहीं हैं, उन्हें बस ignore करना चाहिए। वे धीरे-धीरे जीवन में घुसते हैं और vendor lock-in से गला घोंट देते हैं

  • बंद स्रोत वाले चीनी agent system पर भरोसा करना मुश्किल लगता है
    असल में यह पूरे user permissions वाला एक black box है, यानी आप अपना पूरा system चीनी स्वामित्व वाले servers को सौंप रहे हैं। OpenCode और GLM provider इस्तेमाल करने पर कम-से-कम यह monitor किया जा सकता है कि कौन-सी files पढ़ी गईं, कौन-सी files edit हुईं, और कौन-से commands चले
    इसके अलावा, चीन का National Security Law कंपनियों को national intelligence agencies और counterintelligence activities में सहयोग करने के लिए कानूनी रूप से बाध्य करता है [0]। अगर आपने इसे किसी corporate workstation पर install किया है और company का size पर्याप्त बड़ा है, तो निगरानी की संभावना सिर्फ एक risk नहीं, बल्कि लगभग निश्चित चीज़ के करीब है
    [0]: https://en.wikipedia.org/wiki/National_Intelligence_Law_of_t...

    • सहमत। अमेरिकी competitors पर भी भरोसा करना उतना ही मुश्किल है। यहाँ open source ही जवाब लगता है
    • कम-से-कम model weights public हैं। मैं अमेरिकी नहीं हूँ, इसलिए मेरे लिए हर संभव पहलू में यह कहीं ज़्यादा भरोसेमंद है
      आप ऐसे बात कर रहे हैं जैसे अमेरिकी intelligence agencies अच्छी तरफ हों, लेकिन कम-से-कम मेरे लिए तो बिल्कुल नहीं
    • अमेरिकी providers भी बिल्कुल वही हैं
    • इसे Opencode के नीचे container में run कर सकते हैं। बहुत अच्छे से चलता है, और मैंने Pro plan पर भी upgrade किया है (लगभग $60/month)। अगर container में इस्तेमाल करना चाहते हैं, तो मेरे profile के project में जानकारी है। वह code पूरा open source है, और मैंने अपने काम की ज़रूरत के लिए बनाया है। और भी अनगिनत तरीके होंगे
      लेकिन company चाहे किसी भी देश की हो, मैं किसी भी agent को bare metal पर run करने का कड़ा विरोध करता हूँ। अपने paper में भी मैंने इस point को सीधे और बार-बार cover किया है
      हाल ही में कोई मुझसे बहस कर रहा था कि इतने कम stars वाले software को क्यों run कर रहे हो; ऐसी logic पर मेरे पास कहने को ज्यादा कुछ नहीं है। मैंने ऐसे systems design और build किए हैं जिन्होंने tens of thousands users को handle किया है। मैं मज़ाक नहीं कर रहा। मेरे बनाने का तरीका common नहीं है और मैं दूसरों को इसे follow करने की सलाह भी नहीं देता, लेकिन मेरे लिए यह अच्छा काम करता है और complex systems को handle करने के मेरे सोचने के तरीके से मेल खाता है
      इस्तेमाल करें या न करें, आपकी मर्जी, लेकिन अगर बिना ठोस आधार के उलझेंगे तो जवाब मिलने के लिए भी तैयार रहना होगा। career के दौरान मैंने भी बहुत गलतियाँ की हैं, और मुझे लगता है accountability growth के लिए ज़रूरी है। अगर कोई valid और substantive criticism लेकर आता है, तो मैं अपने code का इस्तेमाल कराने में उसके साथ खुशी से काम कर सकता हूँ
    • इसलिए मुझे Deepseek के साथ Reasonix इस्तेमाल करना पसंद है। cache hit होने पर request practically free हो जाती है, और वह route भी Digital Ocean या Cloudflare जैसे unsubsidized अमेरिकी providers से होकर जाता है