- Gemini और Whisk के ज़रिए टेक्स्ट-आधारित प्रॉम्प्ट को हाई-रेज़ोल्यूशन 8-सेकंड वीडियो में बदला जा सकता है
- Veo 2 मॉडल का उपयोग करके यथार्थपूर्ण वीडियो बनाए जा सकते हैं, और यह Google One AI Premium सब्सक्राइबरों के लिए उपलब्ध है
- Whisk Animate के माध्यम से इमेज को 8-सेकंड की एनिमेशन क्लिप में बदला जा सकता है
- सुरक्षा के लिए, बनाए गए सभी वीडियो में SynthID डिजिटल वॉटरमार्क शामिल होता है
Gemini में वीडियो बनाने का तरीका
- Veo 2 एक ऐसा मॉडल है जो हाई-रेज़ोल्यूशन, बारीक वीडियो बना सकता है, और यथार्थपूर्ण भौतिकी तथा मानव गतिविधियों को समझकर जीवंत कैरेक्टर मूवमेंट और वास्तविक दृश्य प्रदान करता है
- उपयोगकर्ता Gemini में Veo 2 चुनकर 720p रेज़ोल्यूशन की 8-सेकंड वीडियो क्लिप बना सकते हैं
- दृश्य का वर्णन करने पर Gemini विचारों को वीडियो में बदल देता है, और विवरण जितना अधिक होगा, अंतिम वीडियो पर उतना अधिक नियंत्रण संभव होगा
- बनाए गए वीडियो को TikTok या YouTube Shorts जैसे प्लेटफ़ॉर्म पर आसानी से साझा किया जा सकता है
Whisk Animate के साथ इमेज में जान डालना
- Whisk एक Google Labs प्रयोग है, जो टेक्स्ट और इमेज प्रॉम्प्ट का उपयोग करके नए विचारों को विज़ुअलाइज़ करने देता है
- Whisk Animate के माध्यम से इमेज को जीवंत 8-सेकंड वीडियो में बदला जा सकता है, और यह Google One AI Premium सब्सक्राइबरों के लिए उपलब्ध है
सुरक्षा के लिए दृष्टिकोण
- वीडियो जनरेशन की सुरक्षा के लिए Veo 2 से बनाए गए सभी वीडियो में SynthID डिजिटल वॉटरमार्क शामिल होता है
- उपयोगकर्ता फीडबैक के आधार पर लगातार सुधार किए जाएंगे, और नीति-उल्लंघन करने वाली सामग्री के निर्माण को रोकने के लिए मूल्यांकन जारी है
2 टिप्पणियां
Google DeepMind, वीडियो जनरेशन मॉडल Veo 2 का अनावरण
Hacker News राय
Whisk कुछ महीने पहले Imagen 3 के डेमो के रूप में चुपचाप लॉन्च हुआ था। हैरानी की बात है कि यह मज़ेदार है और इसका implementation मज़बूत है
मैं Polymarket के उस event में "हाँ" वाले shares खरीदना चाहता हूँ कि 2027 तक एक व्यक्ति द्वारा बनाई गई फिल्म 100 million dollars से ज़्यादा कमाएगी
Veo2 में 8 सेकंड के 12 वीडियो बनाने पर GCP credits में 48 dollars खर्च हो गए। सावधानी ज़रूरी है
मैंने नहीं सोचा था कि 8 सेकंड के वीडियो बनाना paid API के बाहर संभव होगा
मैं इस क्षेत्र में तकनीकी रूप से बहुत दक्ष नहीं हूँ, लेकिन मुझे जिज्ञासा है कि सब कुछ text-to-X क्यों है
Ghibli style में विज्ञापन बनाना साहसिक है। मुझे लगा था कि अब तक वह style थक चुका होगा
Google Vids भी Veo 2 का उपयोग करता है। products को लेकर भ्रम है
content moderation बहुत निराशाजनक है। यह Veo2 और Gemini के आखिरकार असफल होने का मुख्य कारण हो सकता है
यह सब तकनीकी रूप से चौंकाने वाला है, लेकिन इस क्षेत्र में गंभीर मेहनत करने वाले व्यक्ति के लिए यह एक बड़ी चेतावनी है
Krita से जुड़ा हुआ और img2img, masking, txt2img को मिलाने वाला Krita-ai-diffusion कलाकारों को सशक्त बनाने के सबसे करीब का tool है
एक साल पहले की तुलना में यह बहुत प्रभावशाली release है। अभी ML में सभी बड़ी कंपनियाँ एक-दूसरे से प्रतिस्पर्धा करते हुए तकनीक को आगे बढ़ा रही हैं, जो अच्छी स्थिति है। यह अमेरिका में (या सामान्य रूप से) दुर्लभ बात है