- MK-1 एक नई कंपनी है, जिसका लक्ष्य OpenAI, Anthropic और Google जैसी शीर्ष AI कंपनियों के बराबर या उनसे बेहतर क्षमता वाले AI मॉडल प्रदान करना है.
- कंपनी का पहला प्रोडक्ट MKML एक inference runtime है, जो सिर्फ कुछ पंक्तियों के Python कोड से GPU पर बड़े language model (LLM) inference की लागत को 2 गुना तक कम कर सकता है.
- MKML, Hugging Face और PyTorch जैसे लोकप्रिय ecosystem के साथ compatible है.
- MKML फिलहाल closed beta release चरण में है और शुरुआती partners की तलाश कर रहा है.
- MKML, AI मॉडलों की memory usage कम करने और speed बढ़ाने के लिए optimization में मदद कर सकता है. उदाहरण के लिए, यह Llama-2 13B मॉडल को 26GB से 10.5GB तक घटा सकता है और forward pass की inference time को अधिकतम 2.3 गुना तक कम कर सकता है.
- MKML का उपयोग AI मॉडलों को cost या speed के आधार पर optimize करने के लिए किया जा सकता है. cost optimization scenario में, यह मॉडल को कम महंगे GPU instances पर फिट होने लायक बना सकता है, और अधिक महंगे instances पर base model से तेज चला सकता है. speed optimization scenario में, MKML मॉडल को अधिकतम 2.0 गुना तेज बना सकता है, जिससे अधिक users को service दी जा सकती है.
- MKML को मौजूदा workflow में आसानी से integrate किया जा सकता है. इसमें MKML के model codecs में से किसी एक का उपयोग करके मॉडल को एक बार compress करना, compressed model को disk पर save करना, और फिर inference के लिए उसे load करना शामिल है.
- MKML विभिन्न model sizes और system configurations को support करता है, और speed tests में लगातार baseline से तेज प्रदर्शन करता है.
- MKML, मूल मॉडल के प्रति उच्च fidelity भी बनाए रखता है, और standard perplexity measurements में अंतर नगण्य दिखाता है.
- MK-1 का दीर्घकालिक vision पूरे inference stack में AI performance को उसकी सीमा तक पहुँचाना है. उनके पास future development के लिए एक महत्वाकांक्षी roadmap है.
1 टिप्पणियां
Hacker News राय