• कृत्रिम बुद्धिमत्ता की दक्षता और दीर्घकालिक कार्य निष्पादन क्षमता को मजबूत करने वाला large language model
  • पिछले संस्करण की तुलना में 744 अरब पैरामीटर (सक्रिय 40 अरब) तक विस्तार, और प्री-ट्रेनिंग डेटा 28.5 ट्रिलियन टोकन तक वृद्धि
  • DeepSeek Sparse Attention (DSA) के एकीकरण से लंबे context को संभालने की क्षमता बनाए रखते हुए deployment लागत में कमी
  • नई asynchronous reinforcement learning infrastructure slime के जरिए प्रशिक्षण दक्षता बढ़ाई गई, और कई benchmarks में शीर्ष स्तर का प्रदर्शन दर्ज
  • open source के रूप में जारी, Hugging Face, ModelScope, Z.ai platform आदि पर उपलब्ध, और Claude Code तथा OpenClaw के साथ संगत

GLM-5 का अवलोकन

  • GLM-5 को जटिल सिस्टम इंजीनियरिंग और दीर्घकालिक एजेंट कार्यों के निष्पादन को लक्ष्य बनाकर डिज़ाइन किया गया है
    • GLM-4.5 की तुलना में पैरामीटर 355 अरब (सक्रिय 32 अरब) से बढ़कर 744 अरब (सक्रिय 40 अरब) हुए
    • प्री-ट्रेनिंग डेटा 23 ट्रिलियन से बढ़कर 28.5 ट्रिलियन टोकन हुआ
  • DeepSeek Sparse Attention (DSA) को एकीकृत कर लंबे context की प्रोसेसिंग क्षमता बनाए रखते हुए deployment लागत में बड़ी कमी की गई
  • slime नाम की asynchronous reinforcement learning infrastructure को अपनाकर training throughput और efficiency में सुधार किया गया, जिससे अधिक सूक्ष्म post-training iterations संभव हुए

प्रदर्शन सुधार और benchmark परिणाम

  • GLM-5, GLM-4.7 की तुलना में समग्र प्रदर्शन में सुधार दिखाता है और Claude Opus 4.5 स्तर के करीब पहुंचता है
  • आंतरिक evaluation set CC-Bench-V2 में frontend, backend और दीर्घकालिक कार्यों में उत्कृष्ट परिणाम
  • Vending Bench 2 में open source मॉडलों में पहला स्थान, और 1 साल की vending machine business simulation में अंतिम बैलेंस $4,432 हासिल
  • reasoning, coding और agent tasks में विश्व-स्तरीय open source प्रदर्शन
    • उदाहरण: SWE-bench Verified 77.8, BrowseComp 62.0, τ²-Bench 89.7
  • GPT-5.2, Gemini 3.0 Pro जैसे शीर्ष मॉडलों के साथ अंतर कम किया

open source रिलीज़ और access मार्ग

  • GLM-5 को MIT license के तहत जारी किया गया है, और Hugging Face तथा ModelScope से model weights डाउनलोड किए जा सकते हैं
  • Z.ai, BigModel.cn, api.z.ai आदि पर API रूप में उपयोग संभव
  • Claude Code और OpenClaw के साथ संगत, इसलिए विभिन्न development environments में एकीकृत उपयोग संभव
  • Z.ai platform पर मुफ्त ट्रायल उपलब्ध

office और document generation फीचर

  • GLM-5 “chat से work तक” के बदलाव को लक्ष्य बनाता है, और knowledge workers तथा engineers के लिए office tool की भूमिका निभाता है
  • टेक्स्ट या source materials को सीधे .docx, .pdf, .xlsx फ़ॉर्मेट में बदलकर PRD, परीक्षा-पत्र, financial reports, menu आदि पूर्ण दस्तावेज़ बना सकता है
  • Z.ai application PDF/Word/Excel generation को सपोर्ट करने वाला Agent mode देता है, जिससे multi-turn collaboration संभव होती है

डेवलपर और deployment समर्थन

  • GLM Coding Plan subscribers को चरणबद्ध तरीके से GLM-5 access मिलेगा
    • Max plan उपयोगकर्ता इसे तुरंत "GLM-5" मॉडल नाम से सक्रिय कर सकते हैं
    • GLM-5 requests, GLM-4.7 की तुलना में अधिक quota खर्च करते हैं
  • GUI environment पसंद करने वाले उपयोगकर्ताओं के लिए Z Code agent development environment उपलब्ध
  • OpenClaw framework के जरिए GLM-5 को ऐसे personal assistant agent के रूप में इस्तेमाल किया जा सकता है जो apps और devices में काम करे

लोकल deployment और hardware compatibility

  • GLM-5, vLLM, SGLang जैसे inference frameworks को सपोर्ट करता है, और आधिकारिक GitHub पर deployment निर्देश उपलब्ध हैं
  • NVIDIA के अलावा अन्य chipsets (Huawei Ascend, Moore Threads, Cambricon, Kunlun, MetaX, Enflame, Hygon आदि) पर भी चल सकता है
    • kernel optimization और model quantization के जरिए व्यावहारिक throughput सुनिश्चित किया गया है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.