2 पॉइंट द्वारा GN⁺ 2025-02-07 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Gemini 2.0 की सामान्य उपलब्धता

    • 2024 I/O में पहली बार पेश की गई Flash series models बड़े पैमाने पर high-frequency tasks के लिए अनुकूलित शक्तिशाली मॉडल हैं, और डेवलपर्स के बीच लोकप्रिय रहे हैं
    • 2.0 Flash अब अधिक उपयोगकर्ताओं के लिए सामान्य रूप से उपलब्ध है, और प्रमुख benchmarks में इसका प्रदर्शन बेहतर हुआ है
    • image generation और speech conversion features भी जल्द जोड़े जाएंगे
  • 2.0 Pro experimental model: सर्वश्रेष्ठ coding performance और complex prompt handling

    • Gemini 2.0 Pro coding performance और complex prompts को संभालने की क्षमता के मामले में सबसे उत्कृष्ट मॉडल है, और world knowledge की समझ तथा reasoning क्षमता बेहतर हुई है
    • यह 2 million tokens की सबसे बड़ी context window प्रदान करता है, जिससे विशाल जानकारी का समग्र विश्लेषण और समझ संभव है
    • यह Google AI Studio और Vertex AI में डेवलपर्स के लिए experimental model के रूप में उपलब्ध है, और Gemini Advanced उपयोगकर्ता भी इसका उपयोग कर सकते हैं
  • 2.0 Flash-Lite: सबसे cost-efficient model

    • 1.5 Flash की price और speed पर मिले सकारात्मक feedback के आधार पर, 2.0 Flash-Lite वही speed और cost पर बेहतर quality प्रदान करता है
    • यह अधिकांश benchmarks में 1.5 Flash से बेहतर है, और 1 million tokens की context window तथा multimodal input को support करता है
    • यह Google AI Studio और Vertex AI में public preview के रूप में उपलब्ध है
  • जिम्मेदारी और सुरक्षा कार्य

    • Gemini model family के अधिक शक्तिशाली होने के साथ, सुरक्षित और security-focused उपयोग के लिए मजबूत उपायों में निवेश जारी है
    • नई reinforcement learning techniques का उपयोग करके Gemini को अपनी ही responses की आलोचना करने के लिए सक्षम बनाया गया है, ताकि अधिक सटीक और लक्ष्य-उन्मुख feedback दिया जा सके
    • automated red teaming का उपयोग करके indirect prompt injection जैसे cyber security attacks के जोखिम का आकलन किया जा रहा है

1 टिप्पणियां

 
GN⁺ 2025-02-07
Hacker News की राय
  • Gemini मॉडल के बारे में स्पष्ट जानकारी की कमी से भ्रम पैदा होता है। Google Workspace सब्सक्रिप्शन में शामिल Gemini Advanced के बारे में भी पर्याप्त जानकारी नहीं है.

    • सिर्फ़ "Gemini Advanced" नाम दिखता है, लेकिन मॉडल चुनने का कोई विकल्प नहीं है.
    • Google AI Studio, LLM wrapper ऐप बनाने पर केंद्रित है, लेकिन जो उपयोगकर्ता सिर्फ़ सवालों के जवाब चाहते हैं उनके लिए यह उपयुक्त नहीं है.
    • सर्च से मिली जानकारी अनिश्चित है, और यह जानकारी मिलती है कि Gemini Advanced, Workspace सब्सक्रिप्शन में शामिल है.
    • gemini.google.com पेज पर मॉडल के बारे में कोई जानकारी नहीं है, और सेटिंग्स में सिर्फ़ dark mode बदलने का विकल्प है.
  • Google AI Studio और Vertex AI के ज़रिए Gemini API तक पहुँचा जा सकता है.

    • कई मॉडल मौजूद हैं, जैसे Gemini 2.0, 2.0 Pro, 2.0 Pro Experimental, Gemini 2.0 Flash, Gemini 2.0 Flash Lite आदि.
    • बेंचमार्क की तुलना सिर्फ़ इनके अपने मॉडलों से की गई है.
  • voice chat के दौरान राजनीतिक विषयों पर पाबंदियाँ हैं.

    • जब एक उपयोगकर्ता cooking plan के बारे में बात कर रहा था, तो उसे राजनीतिक विषय समझ लिया गया और बातचीत सीमित कर दी गई.
  • AI मॉडलों के नाम भ्रमित करने वाले हैं.

    • Flash, Flash-Lite जैसी naming convention समझना मुश्किल है.
    • एक राय यह भी है कि Google मॉडलों की गुणवत्ता दूसरे प्रमुख vendors की तुलना में कम है.
  • PDF parsing में कीमत के हिसाब से प्रदर्शन बहुत अच्छा है.

    • Gemini Flash-Lite cost-effective है, और लोग Lite वर्ज़न के बेंचमार्क देखने की उम्मीद कर रहे हैं.
  • AI Studio में नए मॉडलों के साथ प्रयोग किया जा सकता है.

    • live mode के ज़रिए real-time बातचीत संभव है, और camera के माध्यम से दुनिया को देखा जा सकता है.
  • Gemini 2.0 Flash-Lite की कीमत OpenAI के GPT-4o mini से कम है.

    • text/image input और audio input, दोनों के लिए कीमतें तुलनात्मक रूप से सस्ती हैं.
  • Gemini Pro 2.0 मॉडल प्रभावशाली है.

    • research, analysis, writing जैसे सामान्य cognitive tasks के लिए यह उपयुक्त है.
    • इसे AI Studio के माध्यम से इस्तेमाल करने की सलाह दी जाती है, क्योंकि Gemini ऐप में बहुत से filters हैं, जिससे विवादास्पद विषयों पर जवाब सीमित हो सकते हैं.
  • Gemini 2.0 Flash मॉडल multimodal कार्यों में उत्कृष्ट है.

    • यह documents के काम और object detection के लिए उपयुक्त है, और कीमत के मुकाबले प्रदर्शन अच्छा है.
    • Qwen2.5 VL 72B और 7B मॉडल document image tasks में बेहतर प्रदर्शन दिखाते हैं.
  • Gemini 2.0 Pro Experimental मॉडल पर काफ़ी ध्यान दिया जा रहा है.

    • यह जटिल prompts को संभालने और coding performance में उत्कृष्ट है, और 20 लाख tokens की context window देता है.