19 पॉइंट द्वारा xguru 2024-05-15 | 6 टिप्पणियां | WhatsApp पर शेयर करें

Gemini 1.5 Flash मॉडल की घोषणा

  • Gemini 1.5 Pro जितना शक्तिशाली, लेकिन संकीर्ण, बार-बार होने वाले और कम latency वाले कामों के लिए अनुकूलित नया multimodal मॉडल
  • तेज़ response generation के लिए अधिक उपयुक्त
  • Gemini 1.5 की translation, reasoning और coding क्षमताओं में भी सुधार
  • Gemini 1.5 Pro की context window (यह जितनी जानकारी समाहित कर सकता है) 10 लाख tokens से दोगुनी होकर 20 लाख tokens हो गई

Project Astra: Google का Star Trek AI भविष्य-दृष्टिकोण

  • एक multimodal AI assistant, जिसका लक्ष्य डिवाइस के कैमरे के ज़रिए देखना और समझना, चीज़ों की जगह याद रखना, और उपयोगकर्ता की ओर से काम करना है
  • इस साल I/O के सबसे प्रभावशाली डेमो में से अधिकांश में इसका उपयोग हुआ
  • लक्ष्य सिर्फ बातचीत से आगे बढ़कर ऐसा वास्तविक AI agent बनना है जो सचमुच उपयोगकर्ता की ओर से काम करे

Veo: Google का Sora-स्टाइल वीडियो generation

  • OpenAI के Sora के जवाब में Google का नया generative AI मॉडल, जो text, image और video-आधारित prompts का उपयोग करके 1080p वीडियो आउटपुट कर सकता है
  • aerial shot या timelapse जैसी विभिन्न styles में वीडियो बना सकता है, और अतिरिक्त prompts से इसे fine-tune किया जा सकता है
  • कुछ creators को YouTube वीडियो बनाने के लिए उपलब्ध कराया जा रहा है, और इसे फिल्म निर्माण में भी उपयोगी बताया जा रहा है

Gemini का Workspace integration

  • अगली पीढ़ी का language model Gemini 1.5 Pro, Docs, Sheets, Slides, Drive और Gmail के sidebar में integrated किया गया
  • यह अगले महीने paid subscribers के लिए उपलब्ध होगा और Workspace के भीतर एक general-purpose assistant की भूमिका निभाएगा
  • यह Drive की सभी content से जानकारी ला सकता है
  • यह मौजूदा देखे जा रहे दस्तावेज़ की जानकारी मिलाकर ईमेल लिख सकता है, या बाद में पढ़े जा रहे ईमेल का जवाब देने के लिए कह सकता है

Google Lens की क्षमताओं का विस्तार

  • अब सिर्फ image ही नहीं, video से भी search किया जा सकेगा
  • वीडियो रिकॉर्ड करते समय सवाल पूछने पर Google का AI वेब से संबंधित जवाब खोजकर देगा

Gemini का Google Photos में उपयोग

  • इस गर्मियों में आने वाले "Ask Photos" फीचर के ज़रिए यह उपयोगकर्ता की Google Photos लाइब्रेरी का विश्लेषण करके सवालों के जवाब देगा
  • यह सिर्फ कुत्ते या बिल्ली की तस्वीरें ढूँढने से आगे बढ़कर, जैसे CEO Sundar Pichai ने दिखाया, अपनी कार की नंबर प्लेट पूछने जैसे जटिल सवालों के जवाब भी दे सकेगा

Gems: Gemini में customized chatbot बनाने की सुविधा

  • OpenAI के GPT की तरह, Gems के माध्यम से उपयोगकर्ता Gemini को निर्देश देकर उसके response style और expertise को customize कर सकेंगे
  • उदाहरण के लिए, यदि कोई रोज़ motivation और running plan देने वाला सकारात्मक और लगातार प्रोत्साहित करने वाला running coach चाहता है, तो यह जल्द संभव होगा (Gemini Advanced subscribers के लिए)

Gemini की conversational क्षमता में सुधार

  • नया Gemini Live फीचर, Gemini के साथ voice chat को अधिक natural बनाने का लक्ष्य रखता है
  • chatbot की आवाज़ में अधिक personality जोड़ी गई है, और उपयोगकर्ता बीच में रोक सकते हैं या smartphone कैमरे के ज़रिए real time में जानकारी देने के लिए कह सकते हैं
  • Gemini, Google Calendar, Tasks और Keep के साथ integrated है ताकि जानकारी update या retrieve की जा सके, और flyer की details को personal calendar में जोड़ने जैसे multimodal फीचर्स का उपयोग कर सके

Circle to Search में गणित के सवाल हल करने में सहायता

  • अब Android फोन या tablet पर गणित का सवाल घेरने पर उसे हल करने में मदद मिल सकेगी
  • Google का AI छात्रों की cheating में मदद न हो इसलिए सवाल सीधे हल करके नहीं देगा, लेकिन उसे step-by-step तोड़कर पूरा करना आसान बना देगा

Google Search का AI overhaul

  • इस हफ्ते पूरे अमेरिका में "AI Overviews" (जिसे पहले "Search Generative Experience" कहा जाता था) लॉन्च होने वाला है
  • अब एक "specialized" Gemini model search results page को डिज़ाइन करेगा और वेब से संक्षिप्त जवाबों से भरेगा (यह Perplexity या Arc Search जैसे AI search tools में दिखने वाली चीज़ों जैसा है)

Android का AI-आधारित scam detection

  • Google का कहना है कि on-device Gemini Nano AI का उपयोग करके Android फोन ठगों के सामान्य बातचीत पैटर्न जैसे जोखिम संकेत पहचान सकेंगे और real time warnings दिखाकर scam calls से बचने में मदद करेंगे
  • इस फीचर के बारे में अधिक जानकारी साल के अंत में दी जाएगी

Android डिवाइसों की AI intelligence में सुधार

  • Google ने कहा कि Gemini जल्द ही उपयोगकर्ताओं को स्क्रीन पर चल रहे वीडियो के बारे में सवाल पूछने देगा और auto captions के आधार पर जवाब देगा
  • paid Gemini Advanced users के लिए यह PDF को भी समाहित करके जानकारी दे सकेगा
  • Android पर Gemini के ये multimodal updates और अन्य updates आने वाले महीनों में उपलब्ध होंगे

Google Chrome में AI assistant जोड़ा गया

  • Google ने घोषणा की कि वह desktop के Chrome में Gemini Nano का एक lightweight version जोड़ रहा है
  • built-in assistant on-device AI का उपयोग करके Google Chrome के भीतर सीधे social media posts, product reviews आदि के लिए text generation में मदद करेगा

SynthID AI watermarking upgrade

  • Google ने कहा कि वह SynthID की क्षमताओं का विस्तार कर रहा है
  • नया Veo वीडियो generator से बने content में watermarking डाली जाएगी, और अब AI-generated वीडियो का detection भी संभव होगा

6 टिप्पणियां

 
pinks 2024-05-16

चैटबॉट का मुफ्त में उपलब्ध होना ही काफी है, और मैं image, video या audio से जुड़े फीचर्स का इस्तेमाल नहीं करता, इसलिए उनका मौजूदा प्रोडक्ट्स में इंटीग्रेट होना अच्छा लगा।

 
corelyai 2024-05-15

Google के Project Astra AI और video generation में प्रगति

Google का Gemini मॉडल 15 लाख से अधिक developers द्वारा code debugging, insights हासिल करने और AI applications बनाने के लिए व्यापक रूप से इस्तेमाल किया जा रहा है। Project Astra ऐसे AI agent पेश कर रहा है जो video और voice input जानकारी को कुशलता से प्रोसेस कर सकता है, साथ ही नया advanced generative video model Vo भी ला रहा है। Vo text, image और video prompts से उच्च-गुणवत्ता वाले 1080p वीडियो बना सकता है, जिससे अभूतपूर्व creative control मिलता है। Google DeepMind द्वारा विकसित इस तकनीक का लक्ष्य उन ideas को साकार करना है जो पहले संभव नहीं थे.

Google की 6वीं पीढ़ी की TPU और अभिनव AI overhaul

Google 2024 के अंत में 6वीं पीढ़ी की TPU Trillium लॉन्च करेगा, जिसे cloud ग्राहकों के लिए उपलब्ध कराया जाएगा, और इसकी per-chip computing performance 4.7 गुना बेहतर है। कंपनी विभिन्न workloads को support करने के लिए Axion processor और Envidia Blackwell GPU सहित नए CPU और GPU भी पेश कर रही है, जिनमें से बाद वाला 2025 की शुरुआत में उपलब्ध होगा। Google Gemini के साथ पूरी तरह नया AI-आधारित search experience भी लॉन्च कर रहा है, जिसे पहले अमेरिका में जारी किया जाएगा और जिसके प्रति users की संतुष्टि अधिक रही है। यह नया search model अधिक जटिल queries और photo search को संभव बनाता है, और बेहतर user experience के लिए structured results प्रदान करता है।

Google की नई AI सुविधाएँ और भविष्य के innovations

Google AI द्वारा व्यवस्थित नया search results page पेश कर रहा है, जिसकी शुरुआत food और recipes से होगी और बाद में इसे अन्य categories तक विस्तारित किया जाएगा। AI मौसम जैसे contextual factors का उपयोग करके समस्या के कारण और उसे हल करने के steps का overview दे सकता है। Google का AI Gemini जल्द ही live experience देगा, जिसमें 'Gems' नाम के customized personal experts होंगे, और video understanding के लिए इसे Project Astra के साथ integrate किया जाएगा।

Android के लिए नए AI assistant Gemini का परिचय

Gemini Android के लिए नया AI assistant है, जो data privacy को प्राथमिकता देते हुए on-device AI experience प्रदान करता है। इसे context के अनुसार सुझाव देने के लिए डिज़ाइन किया गया है, जैसे पढ़ाई में मदद करना और कठिन समस्याओं के लिए step-by-step guidance देना। Gemini image ढूँढ़ने, खास सवालों के जवाब देने जैसे कामों में भी मदद कर सकता है, और यह सब user workflow में सहज रूप से integrated रहते हुए करता है।

Google के Gemini का smartphone उपयोग पर प्रभाव

Google का Gemini smartphone users को AI features उपलब्ध कराता है, जिससे documents में मौजूद जानकारी तक आसानी से पहुँचा जा सकता है और खास सवालों के स्पष्ट जवाब मिलते हैं। On-device foundation model तेज़ responses देता है और साथ ही user privacy को प्राथमिकता देकर smartphone experience को बेहतर बनाता है। जल्द आने वाला Gemini Nano model इन संभावनाओं को और बढ़ाएगा, जिससे phone text, visuals, sounds और spoken language के जरिए दुनिया को समझ सकेगा।

Corely, YouTube के मुख्य कंटेंट को सिर्फ 10 सेकंड में! - https://corely.ai/content/google-io-2024-everything-revealed

 
savvykang 2024-05-15

https://killedbygoogle.com
मुझे जिज्ञासा है कि Gemini इस सूची में कब शामिल होगा। अगर पैसे नहीं बनते, तो बिना किसी हिचक के बंद कर देना Google की आदत है, इसलिए उससे लगाव नहीं हो पाता।

 
xguru 2024-05-15

अगर GPT-4o की घोषणा नहीं हुई होती तो यह काफ़ी अच्छा लगता, लेकिन कुल मिलाकर प्रस्तुति का असर काफी फीका पड़ गया।
Google के नज़रिए से देखें तो OpenAI सच में काफी खटकता होगा।

 
riskatcher 2024-05-15

पहले Google ने जो rock-paper-scissors demo दिखाया था, उसे OpenAI ने लॉन्च कर दिया, लेकिन Google अभी भी उसके आसपास भी नहीं पहुँचा है... इस बार जो चीज़ें दिखाई गईं, उन्हें भी आखिर कब तक सच में लागू किया जाएगा, यही सोचकर देख रहा था lol