2 पॉइंट द्वारा GN⁺ 2025-03-23 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Google ने Gemini AI तकनीक पर आधारित Gemma AI मॉडल के उत्तराधिकारी संस्करण Gemma 3 की घोषणा की
  • Gemma 3 को इस तरह डिज़ाइन किया गया है कि डेवलपर्स विभिन्न प्लेटफ़ॉर्म पर AI एप्लिकेशन चला सकें
    • स्मार्टफ़ोन से लेकर वर्कस्टेशन तक चलाया जा सकता है
    • 35 से अधिक भाषाओं का समर्थन
    • टेक्स्ट, इमेज और छोटे वीडियो का विश्लेषण कर सकता है
  • Google का दावा है कि Gemma 3 "दुनिया का सबसे बेहतरीन single-accelerator model" है
    • एकल GPU पर Facebook के Llama, DeepSeek और OpenAI के मॉडलों से बेहतर प्रदर्शन
    • Nvidia GPU और समर्पित AI हार्डवेयर पर अनुकूलित प्रदर्शन
    • vision encoder में सुधार
      • उच्च-रिज़ॉल्यूशन और non-square इमेज का समर्थन
    • नया ShieldGemma 2 image safety classifier शामिल
      • sexually explicit content, खतरनाक या हिंसक सामग्री को फ़िल्टर करता है
  • Gemma 3, Chatbot Arena की ELO score ranking में शीर्ष समूह में पहुँचा
    • एकल Nvidia H100 GPU पर उच्च प्रदर्शन दर्ज किया
  • Gemma मॉडल की "open" या "open source" परिभाषा को लेकर विवाद जारी
    • Google का लाइसेंस उपयोग पर प्रतिबंध रखता है, और इस घोषणा में भी इसमें कोई बदलाव नहीं है

1 टिप्पणियां

 
GN⁺ 2025-03-23
Hacker News टिप्पणियाँ
  • कुछ AI मॉडल प्रार्थना कर सकते हैं। बाइबिल संबंधी सलाह मांगी तो उसने कहा कि वह प्रार्थना करेगा
  • जिज्ञासा है कि कोई मॉडल कितना छोटा होकर भी "सामान्य रूप से बुद्धिमान" हो सकता है। लगता है कि एक ऐसा आकार होगा जो सारी जानकारी समेटने के लिए बहुत छोटा होगा
    • सोचता हूँ कि किसी खास क्षेत्र में विशेषज्ञ छोटे मॉडल कब आएँगे। उदाहरण के लिए, कोडिंग में मदद लेते समय "Jaws" के निर्देशक का नाम जानना जरूरी नहीं होगा
    • शायद भविष्य में बहुत सारे छोटे, विशेषज्ञ मॉडल होंगे
    • या फिर computing performance इतनी बढ़ जाएगी कि desktop या phone पर पूरी क्षमता वाला मॉडल चलाया जा सकेगा
  • Llama 3.3 70B को शायद "एक GPU" पर चलने वाला नहीं माना जाएगा, लेकिन एक Mac पर यह अच्छी तरह चलता है
    • लंबी बातचीत में concepts को बनाए रखने में यह Gemma 3 से काफी बेहतर है
  • Gemma 3, 2 की तुलना में writing में बहुत बेहतर है
    • बड़ा सुधार यह है कि 32k+ context window का वास्तव में उपयोग किया जा सकता है और यह random कचरे में नहीं बदलता
  • Mistral ने 3.1 Small जारी किया, और यह बढ़त सिर्फ एक हफ्ते तक ही रही। AI की प्रगति की रफ्तार तेज है
  • Mistral Small 3.1, Gemma 3 के बाद जारी हुआ और यह काफी बेहतर है
    • इसमें कम refusal है, यह अधिक सटीक है, कम भटकता है, और खासकर coding में बेहतर है
  • तकनीकी रूप से, 1.58-bit Unsloth quant वाला DeepSeek R1 एक single GPU और 128GB system RAM पर चलता है
    • performance बहुत प्रभावशाली है, लेकिन जल्दबाज़ी न करना ही बेहतर है
  • पिछले हफ्ते की Google पोस्ट: [लिंक]
  • सोच रहा हूँ क्या कोई GoogleAI का उपयोग करता है
    • AI CEO वाली एक AI कंपनी में AI language translation का उपयोग किया जाता है, लेकिन असली GPT products सब खराब हैं और उनकी प्रतिष्ठा भी खराब है
    • कौन अपनी निजी बातचीत Google को भेजकर निगरानी झेलना चाहेगा?
  • जिज्ञासा है कि क्या यह कटे-फटे न्यूनतम स्तर पर चल रहा है