GLM 5.2 लॉन्च
(twitter.com/jietang)- GLM-5.2 एक ओपन सोर्स मॉडल है जो वास्तविक उपयोग योग्य 1M context और लंबी अवधि के कार्यों को स्वतंत्र रूप से पूरा करने का समर्थन करता है, और जटिल एजेंट एप्लिकेशन बनाने के लिए आधार प्रदान करता है
- ऐसे समय में जब गैर-तकनीकी कारणों से frontier model तक पहुंच अचानक रोक दी जाती है, विज्ञान वैश्विक होना चाहिए और AGI की राह ऊंची बाधाओं में बंद नहीं होनी चाहिए
- AGI कुछ लोगों के नियमों द्वारा एकाधिकार में रखी गई और कभी भी वापस ली जा सकने वाली विशेषाधिकार नहीं, बल्कि मानवता के लिए बुद्धिमत्ता की सीमाओं को साथ मिलकर खोजने और जटिल कार्यों को हल करने का साझा आधार होना चाहिए
- GLM-5.2 अब तक Zhipu का सबसे शक्तिशाली ओपन सोर्स मॉडल है, और देश का सबसे मजबूत coding model बनाने के लिए मुख्य इंजन की भूमिका निभाता रहेगा
- इसे पहले GLM Coding Plan के Lite / Pro / Max उपयोगकर्ताओं के लिए उपलब्ध कराया जाएगा, और API अगले सप्ताह जारी होने वाला है, जिससे frontier intelligence तक पहुंच एक कदम और करीब आती है
मुख्य संदेश
- किसी विशेष frontier model पर अचानक लगाया गया प्रतिबंध गहरी खेदजनक बात के रूप में पेश किया गया है, और जब गैर-तकनीकी कारणों से पहुंच टूटती है, तब विज्ञान के वैश्विक होने की आवश्यकता और अधिक मजबूत हो जाती है
- AGI की राह ऊंची बाधाओं से घिरी नहीं होनी चाहिए, और AGI मानवता के लिए बुद्धिमत्ता की सीमाओं को साथ मिलकर खोजने और जटिल चुनौतियों को हल करने की आधारशिला होनी चाहिए
- AGI कुछ लोगों के नियमों द्वारा एकाधिकार में रखी गई और कभी भी वापस ली जा सकने वाली विशेषाधिकार नहीं होनी चाहिए, और बाहरी अवरोधों तथा प्रतिबंधों के सामने अधिक कट्टर खुलापन आवश्यक है
- Frontier intelligence को open source, सुलभता, और निर्माण-योग्यता बनाए रखनी चाहिए, और यह सभी समर्पित डेवलपर्स के लिए उपलब्ध होनी चाहिए
GLM-5.2 का विमोचन और उपयोग समय-सारणी
- GLM-5.2 अब तक Zhipu द्वारा जारी किया गया सबसे शक्तिशाली ओपन सोर्स मॉडल है
- यह मॉडल वास्तविक उपयोग योग्य 1M context window का समर्थन करता है, और लंबी अवधि के कार्यों को स्वतंत्र रूप से पूरा करने में लगातार बढ़त बनाए रखता है
- यह जटिल एजेंट एप्लिकेशन बनाने के लिए मजबूत आधार प्रदान करता है, और देश का सबसे मजबूत coding model बनाने के लिए मुख्य इंजन की भूमिका निभाता रहता है
- GLM-5.2 को 5:21 पर GLM Coding Plan उपयोगकर्ताओं के लिए आधिकारिक रूप से उपलब्ध कराया जाएगा, और इसमें Lite / Pro / Max सभी उपयोगकर्ता शामिल हैं
- API अगले सप्ताह जारी होने वाला है, और ModelKey
GLM-5.2है
1 टिप्पणियां
Hacker News की राय
Z.ai के संस्थापक की घोषणा के अनुसार GLM-5.2 एक “पूरी तरह खुला” मॉडल है, और ऐसे समय में जब कुछ frontier मॉडलों तक पहुंच गैर-तकनीकी कारणों से अचानक सीमित की जा रही है, frontier intelligence सबके लिए खुली होनी चाहिए
GLM-5.2, अब तक का Zhipu का सबसे मजबूत open source मॉडल है, और यह वास्तव में उपयोगी 1M context window तथा लंबे कार्यों को स्वतंत्र रूप से पूरा करने की क्षमता को सामने रखता है
बताया गया है कि इसे पहले GLM Coding Plan के Lite / Pro / Max यूज़र्स को दिया जाएगा, और API अगले हफ्ते जारी होने वाली है
https://x.com/jietang/status/2065784751345287314
यह Qwen जैसे दूसरे चीनी open weight मॉडलों से अलग दिखता है
अभी ऐसा नहीं लगता कि benchmark results वाला कोई आधिकारिक blog post आया है, लेकिन फिर भी यह देखकर दोबारा आभार महसूस होता है कि चीनी AI लैब्स इस तरह अपना काम जारी कर रही हैं और permissive license के साथ दुनिया को योगदान दे रही हैं
Fable 5 की घटना ने फिर दिखाया कि ऐसे खुले मॉडल कितने मूल्यवान हैं
फिर भी काफ़ी प्रभावशाली है और पूरी तरह उपयोगी भी
architecture या जटिल समस्याओं में यह साफ़ तौर पर कमज़ोर है, लेकिन शायद बहुत लोगों ने इससे अलग उम्मीद भी नहीं की होगी
खासकर design और user interface के मामले में यह अपनी श्रेणी से बेहतर करता दिखता है, हालांकि यह व्यक्तिगत पसंद भी हो सकती है
पिछले कुछ दिनों में चीनी लैब्स ने MiniMaxM3, KimiK2.7, और GLM5.2 जारी किए हैं, जबकि उसी दौरान अमेरिका मॉडलों को censor कर रहा है
यह लगभग किसी उपन्यास जैसा लगता है
मौजूदा Anthropic मामले में आप कह सकते हैं कि अमेरिका मॉडल censor कर रहा है, लेकिन इसे ट्रम्प प्रशासन की सामान्य भ्रष्टता, बदले की राजनीति, उगाही, और अक्षमता के रूप में समझना शायद ज़्यादा सही होगा
यह शायद वह C++ library OpenGL Mathematics नहीं है जिसकी उम्मीद की जा रही थी
Fable में अमेरिकी सरकार की हालिया कार्रवाई देखकर, यह रुझान सच में भविष्य जैसा लगने लगा है
किसी ऐसे रणनीतिक उत्पाद पर निर्भर नहीं रहा जा सकता जिसका दरवाज़ा कोई मनमौजी खिलाड़ी बंद कर दे
Open weight models मूल रूप से ऐसी स्थिति के प्रति लगभग प्रतिरक्षित हैं
अमेरिकी सरकार विदेशी open weight मॉडलों के साथ व्यापार करना, उन्हें डाउनलोड करना, या उनका इस्तेमाल करना गैरकानूनी बना सकती है
व्यक्तियों पर इसे लागू करना मुश्किल होगा, लेकिन कंपनियाँ लगभग निश्चित रूप से इसका पालन करेंगी, और अगर यह sanctions के रास्ते गया तो GitHub जैसी US-based hosting से भी इन्हें हटाया जा सकता है
इसके अलावा हम पहले ही डरावने स्तर की mass surveillance की ओर तेज़ी से बढ़ रहे हैं, जो लागू कराने में मदद कर सकती है
Fable की स्थिति बहुत ख़तरनाक मिसाल बना रही है, और ऐसा लगता है कि हम information और computing freedom की लड़ाई हार रहे हैं, इसलिए भविष्य को लेकर चिंता होती है
इस बेहूदा स्थिति को बढ़ावा Anthropic ही दे रहा है
यह बिना कुछ कहे परिणामों की गुणवत्ता घटाता है, और “safety” के नाम पर अनुरोध ठुकरा देता है
भले ही सरकार ने विदेशियों से मॉडल हटाने को न कहा होता, Anthropic अपने आप में इतना खराब है कि स्थिति फिर भी बहुत बुरी रहती
Anthropic को सरकार से Fable प्रतिबंध पत्र चीन समयानुसार शाम 5:21 बजे मिला और ठीक उसी समय यह रिलीज़ भी हुई, साथ ही यह साफ़ तौर पर उस स्थिति का ज़िक्र करती है जहाँ दूसरे मॉडल उपलब्ध नहीं रह जाते
यह काफ़ी अजीब लगता है
क्या यह भी संभव नहीं कि पोस्ट बाद में edit की गई हो?
लगता है कि यह रिलीज़ Mythos ड्रामे की लहर पर सवार होने के लिए जल्दी आगे खींच दी गई
जैसे कह रहे हों, “अफ़सोस कि आप Fable इस्तेमाल नहीं कर सकते, लेकिन वीकेंड में हमारा मॉडल आज़मा लें” — और संभव है कि इसे मूल रूप से अगले हफ्ते जारी होना था, इसलिए benchmarks अभी तक पूरी तरह तैयार नहीं हैं
5.2 flash रिलीज़ का इंतज़ार है
थोड़ा समय बीत चुका है, लेकिन 4.7 flash अब भी सबसे मजबूत local coding मॉडलों में से एक लगता है
local models में अभी भी Qwen-3.5 सबसे अच्छा है
3.6 की VRAM ज़रूरत 24GB से थोड़ा ऊपर चली जाती है, और उसके बाद आप consumer GPU वाली श्रेणी में नहीं रहते
अच्छा होता अगर वे एक blog post लिखते जिसमें नए मॉडल की क्षमता, उससे क्या उम्मीद की जा सकती है, क्या यह सस्ता है, तेज़ है, या output quality बेहतर है, जैसी बातें शामिल होतीं
फिर भी इसे जारी करने के लिए आभार
जिज्ञासा है कि वास्तव में कितना compute चाहिए, और अलग-अलग variants की क्या requirements हैं
यह भी जानना है कि क्या Google के optimization जैसे TurboQuant, MTP, या उनकी अपनी innovations ने frontier quality को local users के लिए व्यावहारिक बनाया है
यह किसी व्यावहारिक अर्थ में local model नहीं है, लेकिन चूँकि यह open model है, इसलिए weights लगभग एक हफ्ते बाद आने पर token pricing पर प्रतिस्पर्धा करने वाले कई third-party inference providers सामने आएँगे
consumer hardware पर प्रभावी ढंग से चलने वाला कोई local model जैसा कुछ नहीं है, और जो ऐसा कहते हैं वे या तो झूठ बोल रहे हैं या भ्रम में हैं