Cactus - स्मार्टफ़ोन के लिए Ollama

(github.com/cactus-compute)

22 पॉइंट द्वारा xguru 2025-08-05 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

एक cross-platform framework जो अलग-अलग डिवाइसों (स्मार्टफ़ोन, लैपटॉप, TV, कैमरा आदि) पर GGUF models को सीधे चलाने में सक्षम बनाता है
- Huggingface; Qwen, Gemma, Llama, DeepSeek आदि से उपलब्ध कोई भी GGUF model इस्तेमाल किया जा सकता है
- ऐप के भीतर सीधे LLM/VLM/TTS models को deploy और run किया जा सकता है
Flutter, React-Native, Kotlin Multiplatform को सपोर्ट करता है, और text, vision, embedding, TTS models जैसे कई प्रकार के models को on-device चलाया जा सकता है
FP32 से लेकर 2-bit quantized models तक सपोर्ट, जिससे mobile environment में high efficiency और low-power operation संभव है
chat templates (Jinja2), token streaming, cloud-local automatic fallback, Speech-To-Text आदि का समर्थन
Cactus backend, C/C++ में लिखा गया है, इसलिए यह mobile, PC, embedded, IoT आदि लगभग सभी environments में सीधे चल सकता है
नवीनतम स्मार्टफ़ोन पर Gemma3 1B Q4 20~50 tokens/second, और Qwen3 4B Q4 7~18 tokens/second की गति से चलता है
HuggingFace Cactus-Compute से recommended models डाउनलोड किए जा सकते हैं

उपयोग के बिंदु और फायदे

मौजूदा on-device LLM frameworks से अलग, यह कई platforms के लिए unified support देता है, जिससे local-cloud hybrid architecture लागू करना आसान होता है
mobile devices पर high-performance और low-power में नवीनतम LLM/VLM/TTS का उपयोग संभव
ऐप/सेवा में private data processing, offline AI उपयोग, cost reduction जैसे कई B2C/B2B scenarios के लिए उपयुक्त

Cactus - स्मार्टफ़ोन के लिए Ollama

उपयोग के बिंदु और फायदे

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.