- कृत्रिम बुद्धिमत्ता की दक्षता और दीर्घकालिक कार्य निष्पादन क्षमता को मजबूत करने वाला large language model
- पिछले संस्करण की तुलना में 744 अरब पैरामीटर (सक्रिय 40 अरब) तक विस्तार, और प्री-ट्रेनिंग डेटा 28.5 ट्रिलियन टोकन तक वृद्धि
- DeepSeek Sparse Attention (DSA) के एकीकरण से लंबे context को संभालने की क्षमता बनाए रखते हुए deployment लागत में कमी
- नई asynchronous reinforcement learning infrastructure
slime के जरिए प्रशिक्षण दक्षता बढ़ाई गई, और कई benchmarks में शीर्ष स्तर का प्रदर्शन दर्ज
- open source के रूप में जारी, Hugging Face, ModelScope, Z.ai platform आदि पर उपलब्ध, और Claude Code तथा OpenClaw के साथ संगत
GLM-5 का अवलोकन
- GLM-5 को जटिल सिस्टम इंजीनियरिंग और दीर्घकालिक एजेंट कार्यों के निष्पादन को लक्ष्य बनाकर डिज़ाइन किया गया है
- GLM-4.5 की तुलना में पैरामीटर 355 अरब (सक्रिय 32 अरब) से बढ़कर 744 अरब (सक्रिय 40 अरब) हुए
- प्री-ट्रेनिंग डेटा 23 ट्रिलियन से बढ़कर 28.5 ट्रिलियन टोकन हुआ
- DeepSeek Sparse Attention (DSA) को एकीकृत कर लंबे context की प्रोसेसिंग क्षमता बनाए रखते हुए deployment लागत में बड़ी कमी की गई
- slime नाम की asynchronous reinforcement learning infrastructure को अपनाकर training throughput और efficiency में सुधार किया गया, जिससे अधिक सूक्ष्म post-training iterations संभव हुए
प्रदर्शन सुधार और benchmark परिणाम
- GLM-5, GLM-4.7 की तुलना में समग्र प्रदर्शन में सुधार दिखाता है और Claude Opus 4.5 स्तर के करीब पहुंचता है
- आंतरिक evaluation set CC-Bench-V2 में frontend, backend और दीर्घकालिक कार्यों में उत्कृष्ट परिणाम
- Vending Bench 2 में open source मॉडलों में पहला स्थान, और 1 साल की vending machine business simulation में अंतिम बैलेंस $4,432 हासिल
- reasoning, coding और agent tasks में विश्व-स्तरीय open source प्रदर्शन
- उदाहरण: SWE-bench Verified 77.8, BrowseComp 62.0, τ²-Bench 89.7
- GPT-5.2, Gemini 3.0 Pro जैसे शीर्ष मॉडलों के साथ अंतर कम किया
open source रिलीज़ और access मार्ग
- GLM-5 को MIT license के तहत जारी किया गया है, और Hugging Face तथा ModelScope से model weights डाउनलोड किए जा सकते हैं
- Z.ai, BigModel.cn, api.z.ai आदि पर API रूप में उपयोग संभव
- Claude Code और OpenClaw के साथ संगत, इसलिए विभिन्न development environments में एकीकृत उपयोग संभव
- Z.ai platform पर मुफ्त ट्रायल उपलब्ध
office और document generation फीचर
- GLM-5 “chat से work तक” के बदलाव को लक्ष्य बनाता है, और knowledge workers तथा engineers के लिए office tool की भूमिका निभाता है
- टेक्स्ट या source materials को सीधे .docx, .pdf, .xlsx फ़ॉर्मेट में बदलकर PRD, परीक्षा-पत्र, financial reports, menu आदि पूर्ण दस्तावेज़ बना सकता है
- Z.ai application PDF/Word/Excel generation को सपोर्ट करने वाला Agent mode देता है, जिससे multi-turn collaboration संभव होती है
डेवलपर और deployment समर्थन
- GLM Coding Plan subscribers को चरणबद्ध तरीके से GLM-5 access मिलेगा
- Max plan उपयोगकर्ता इसे तुरंत
"GLM-5" मॉडल नाम से सक्रिय कर सकते हैं
- GLM-5 requests, GLM-4.7 की तुलना में अधिक quota खर्च करते हैं
- GUI environment पसंद करने वाले उपयोगकर्ताओं के लिए Z Code agent development environment उपलब्ध
- OpenClaw framework के जरिए GLM-5 को ऐसे personal assistant agent के रूप में इस्तेमाल किया जा सकता है जो apps और devices में काम करे
लोकल deployment और hardware compatibility
- GLM-5, vLLM, SGLang जैसे inference frameworks को सपोर्ट करता है, और आधिकारिक GitHub पर deployment निर्देश उपलब्ध हैं
- NVIDIA के अलावा अन्य chipsets (Huawei Ascend, Moore Threads, Cambricon, Kunlun, MetaX, Enflame, Hygon आदि) पर भी चल सकता है
- kernel optimization और model quantization के जरिए व्यावहारिक throughput सुनिश्चित किया गया है
अभी कोई टिप्पणी नहीं है.