Kimi K2 1T मॉडल 512GB वाले दो M3 Ultra पर चला
(twitter.com/awnihannun)- Kimi K2 1T मॉडल को 512GB मेमोरी वाले दो M3 Ultra चिप्स पर चलाए जाने का एक उदाहरण सामने आया
- ट्विटर पोस्ट में इस मॉडल के रनिंग environment और hardware configuration का उल्लेख किया गया
- 1T-स्केल मॉडल को commercial Mac hardware पर चलाया गया, यह बात खास तौर पर ध्यान खींचती है
- यह high-performance Apple Silicon-आधारित AI computation की संभावनाओं को दिखाने वाला उदाहरण है
- यह बड़े language model के local execution की सीमाओं के विस्तार की ओर इशारा करने वाला एक तकनीकी प्रयास है
ट्विटर पोस्ट की सामग्री
- पोस्ट में साफ़ कहा गया है कि Kimi K2 1T मॉडल को दो M3 Ultra (प्रत्येक में 512GB मेमोरी) पर चलाया गया
- अतिरिक्त performance metrics या results के बारे में कोई विवरण नहीं दिया गया
- इस ट्वीट के अलावा कोई अतिरिक्त संदर्भ या विस्तृत तकनीकी जानकारी उपलब्ध नहीं है
1 टिप्पणियां
Hacker News प्रतिक्रियाएँ
यह Opus 4.5 या 5.2-Pro से ज़्यादा स्मार्ट नहीं है, लेकिन इसकी लिखने की शैली बहुत अलग है और इसमें इंसानों की तरह बात करने वाला सीधा-सादा टोन है
ईमेल जैसी छोटी चीज़ें लिखने में यह अभी के सबसे बेहतरीन मॉडलों में है, और बातचीत के दौरान गलतियाँ दिखाने या बकवास को ठीक करने में हिचकिचाता नहीं है
लगता है कि इसे दूसरे मॉडलों से बिल्कुल अलग तरीके से ट्रेन किया गया है, इसलिए यह डेटा विश्लेषण से ज़्यादा editing के लिए बहुत उपयोगी है
इसी वजह से मैं सच में Kimi का subscription लेकर इस्तेमाल कर रहा हूँ
इसकी emotional intelligence शानदार है, यह संदेश के nuance और इरादे को अच्छी तरह समझ लेता है, और social context को भी ध्यान में रखकर वाक्य सुधारता है
Moonshot ने इसे कैसे train किया, पता नहीं, लेकिन यह हिस्सा सच में ध्यान देने लायक है
EQ-bench पर यह emotional intelligence evaluation में पहले स्थान पर रहा, और यह मेरे अपने अनुभव से पूरी तरह मेल खाता है
“reproducible example दो” जैसी बात कहने वाला chatbot देखना अपने आप में दिलचस्प अनुभव है
वैसे Kagi में भी Kimi K2 इस्तेमाल किया जा सकता है
Kimi K2 इस मामले में कितना सटीक है, यह जानने की उत्सुकता है
आखिरकार, मॉडल की असली बात instruction following ही तो है, ऐसा लगता है
इसका ज़रूरत से ज़्यादा चापलूसी न करने वाला रवैया इसे logic check के लिए उपयोगी बनाता है
पुराने ChatGPT मॉडल हर बात की तारीफ करते थे, लेकिन Kimi अगर कहो तो बुद्धि या खानदान तक पर शक करने वाली बेरहम आलोचना कर देता है
उस मॉडल का स्वभाव भी Kimi की तरह बिल्कुल भी चापलूसी वाला नहीं था
Apple आधिकारिक लिंक
gift card के साथ अतिरिक्त 10% discount भी मिल सकता है
RDNA support की बात सुनी है, लेकिन पता नहीं कि यह hardware-dependent है या नहीं (जैसे ConnectX या Apple Thunderbolt चाहिए), या फिर सामान्य 10G NIC से भी काम चल जाएगा
लेकिन vLLM सामान्य Ethernet आधारित multi-node cluster भी support करता है
लंबा context इस्तेमाल करो तो जवाब का इंतज़ार करने में कई मिनट लग सकते हैं
शायद कुछ सालों में यह काफ़ी सस्ती हो जाएँगी
सिर्फ “चलता है” सुनकर भरोसा नहीं करना चाहिए, क्योंकि लंबे context में processing speed बिल्कुल अलग होती है
उतने ही पैसे में cloud usage बहुत ज़्यादा मिल सकता है
ऊपर से इसे 24/7 चलाना भी नहीं होता, इसलिए efficiency कम रहती है
open source मॉडल Groq या Cerebras जैसी ultra-low latency services पर चलाना कहीं ज़्यादा आसान है
Cursor में कई मॉडल test करता हूँ, लेकिन Deepseek v3.2 या Kimi K2 format issues की वजह से ठीक से नहीं चलते, और दूसरे मॉडल भी कई बार गायब रहते हैं
खासकर C++ या Rust जैसे non-web क्षेत्रों के benchmark जानने हैं
क्या 2 Spark और 2 Mac Studio का कॉम्बिनेशन 2 M5 Ultra जितनी inference speed दे पाएगा?