Google AI Edge Gallery - पूरी तरह ऑफलाइन LLM गैलरी ऐप ओपन सोर्स
(github.com/google-ai-edge)- On-device generative AI चलाने के लिए विशेष रूप से बना iOS/Android ऐप, जो इंटरनेट कनेक्शन के बिना पूरी तरह ऑफलाइन·प्राइवेट वातावरण में LLM चलाता है
- Gemma 4 family के लिए आधिकारिक सपोर्ट जोड़ा गया - सर्वर पर भेजे बिना उन्नत reasoning, logic और creative फीचर्स को टेस्ट किया जा सकता है
- Agent Skills: LLM के साथ बातचीत से आगे बढ़कर उसे एक सक्रिय assistant में बदलना
- Wikipedia fact search, interactive maps, visual summary cards जैसे टूल्स से LLM की क्षमताओं का विस्तार
- URL से modular skills लोड करने और GitHub Discussions कम्युनिटी skills खोजने का सपोर्ट
- Thinking Mode: AI चैट के दौरान मॉडल की step-by-step reasoning प्रक्रिया को विज़ुअली देखा जा सकता है (फ़िलहाल केवल Gemma 4 family जैसे supported models तक सीमित)
- Ask Image: कैमरा·फोटो गैलरी का उपयोग कर multimodal object recognition, visual puzzles और detailed descriptions बनाना
- Audio Scribe: on-device मॉडल से real-time speech transcription और translation
- Prompt Lab: temperature, top-k जैसे parameters को बारीकी से समायोजित करते हुए prompts टेस्ट करने के लिए समर्पित workspace
- Mobile Actions : FunctionGemma 270m fine-tuned मॉडल पर आधारित ऑफलाइन डिवाइस कंट्रोल automation
- Tiny Garden : natural language मिनीगेम
- Model Management & Benchmark: open source models डाउनलोड करने, custom models लोड करने और hardware के अनुसार benchmark tests चलाने का सपोर्ट
- LiteRT lightweight runtime + Hugging Face इंटीग्रेशन के साथ मॉडल खोज और optimization
- Android 12+, iOS 17+ सपोर्ट / Google Play , App Store से इंस्टॉल किया जा सकता है / Google Play उपलब्ध न होने वाले वातावरण में GitHub रिलीज़ से APK सीधे इंस्टॉल भी संभव
- लाइसेंस: Apache-2.0 / डेवलपमेंट भाषा: Kotlin
2 टिप्पणियां
https://github.com/google-ai-edge/gallery/issues/437
लगता है Exynos compatibility अच्छी नहीं है। Galaxy Quantum 5 (A55) पर जवाब में चीनी अक्षरों को अनंत बार दोहराने की समस्या दिख रही है।
Hacker News टिप्पणियाँ
यह वाकई प्रभावशाली मॉडल है। मैं इसे अभी Mac पर चला रहा हूँ, और अब यह iPhone पर भी लोकली चल सकता है, तो इसे टेस्ट करना पड़ेगा
मैंने इस मॉडल को heretic स्क्रिप्ट से dealignment(सेंसरशिप हटाना) करके देखा, और यह सच में बहुत अच्छा चला। मैंने खुद gemma4-heretical repo भी बनाकर व्यवस्थित किया है
इसे MLX version में भी बनाया जा सकता है, जो Mac पर थोड़ा तेज़ है, लेकिन Ollama में नहीं चलता (LM Studio में शायद चल जाए)
यह M4 Macbook Pro 128GB पर बहुत अच्छे से चलता है, और 64GB पर भी ठीक चलेगा। मेमोरी कम हो तो quantization level घटाना होगा
मुझे ऐसे लोकल unaligned मॉडल पसंद हैं। बाहरी प्लेटफ़ॉर्म पर सेंसर होने के बजाय, मैं अपने डिवाइस के अंदर आज़ादी से प्रयोग कर सकता हूँ। इससे “संवेदनशील लेकिन उत्पादक” बातचीत संभव होती है
मैंने इसे OpenClaw से जोड़ने की कोशिश की, लेकिन दिक्कत आई। बेशक इस तरह के एप्रोच का दुरुपयोग हो सकता है, लेकिन मेरा मानना है कि अच्छे इरादे वाले उपयोगकर्ता कहीं ज़्यादा हैं
यह ऐप शानदार है, लेकिन E2B मॉडल की पूरी क्षमता नहीं दिखाता
मैंने M3 Pro पर Gemma E2B के साथ real-time audio·video AI बनाया है, और इसे Parlor नाम से /r/LocalLLaMA पर पोस्ट किया था। उसे काफ़ी अच्छा रिस्पॉन्स मिला
मैं इसे Macbook पर चला रहा हूँ, लेकिन इस benchmark के मुताबिक iPhone 17 Pro पर भी यह पूरी तरह संभव है
मैंने iPhone पर मॉडल चलाकर देखा और काफ़ी अच्छे नतीजे मिले। क्लाउड वाले Gemini जितना अच्छा नहीं है, लेकिन काफ़ी उपयोगी है
“मोबाइल एक्शन” फीचर से टॉर्च ऑन करना, मैप खोलना जैसी डिवाइस कंट्रोल की चीज़ें संभव हैं, जो दिलचस्प है। अगर यह Siri Shortcuts के साथ integrate हो जाए तो वाकई बहुत अच्छा होगा
एक teacher app बनाने वाले के तौर पर, लोकल मॉडल के आम होने से मैं बहुत खुश हूँ। privacy कानूनों की वजह से client-side execution महत्वपूर्ण है। iOS या Chrome में on-device model API मौजूद हैं, लेकिन उनकी quality अभी कम है
मुझे लगता है कि AI का व्यावहारिक भविष्य सिर्फ दो ही रूपों में है — लोकल on-device मुफ़्त execution, या क्लाउड पर महंगी सेवाएँ
दूसरा विकल्प सिर्फ उन कामों के लिए इस्तेमाल होगा जहाँ इंसान उससे भी महंगा या धीमा पड़ता है। Gemma 4 मॉडल iPhone और macOS में इंटीग्रेटेड भविष्य के Siri, यानी फ़िल्म “Her” जैसे assistant की संभावना दिखाते हैं
मैं ऐप के English version के लिंक साझा कर रहा हूँ
iOS app Google AI Edge Gallery
Android version
यह Google के Edge project का demo app है
ज़्यादातर मॉडल अभी भी डाउनलोड नहीं किए जा सकते। उम्मीद है जल्द जारी होंगे
किसी ने सवाल उठाया कि App Store वेबपेज नकली जैसा दिखता है। header text pixelated है, background flicker कर रहा है, और icon quality भी कम है
मैंने iPhone 16 Pro पर Gemma-4-E2B-it मॉडल टेस्ट किया, और यह लगभग 30 tokens प्रति सेकंड दे रहा था। फोन काफ़ी गर्म हो गया, लेकिन performance प्रभावशाली थी। मैं इसे अपने ऐप में भी लागू करने वाला हूँ
मेरे बेटे ने Android पर 2B मॉडल इस्तेमाल करना शुरू कर दिया है। यह सस्ते Motorola फोन पर भी अच्छी तरह चलता है, और वह इसका इस्तेमाल विदेशी भाषाएँ पढ़ने-लिखने के अभ्यास में कर रहा है। मॉडल का हल्का होना सच में चौंकाने वाला है
नए मॉडल बहुत प्रभावशाली हैं। AI Edge Gallery GPU पर चलता है, लेकिन नए चिप्स का NPU कहीं ज़्यादा तेज़ है
उदाहरण के लिए, A16 चिप में 35 TOPS का Neural Engine है, जबकि GPU लगभग 7 TFLOPS के स्तर का है। Qualcomm में भी स्थिति मिलती-जुलती है