8 पॉइंट द्वारा GN⁺ 2026-02-13 | 3 टिप्पणियां | WhatsApp पर शेयर करें
  • ByteDance Seed टीम द्वारा जारी अगली पीढ़ी का मल्टीमॉडल वीडियो जनरेशन मॉडल, जो टेक्स्ट, इमेज, ऑडियो और वीडियो इनपुट को एकीकृत रूप से सपोर्ट करता है
  • भौतिक सटीकता और यथार्थवाद को बेहतर बनाया गया है, जिससे जटिल मानव इंटरैक्शन और मूवमेंट वाले दृश्यों में भी उच्च स्थिरता और निरंतरता मिलती है
  • एक साथ अधिकतम 9 इमेज, 3 वीडियो और 3 ऑडियो इनपुट लेकर कंपोज़िशन, मूवमेंट, स्पेशल इफेक्ट्स और साउंड को दर्शाता है, और वीडियो एडिटिंग व एक्सटेंशन फीचर्स से सूक्ष्म नियंत्रण संभव है
  • 15 सेकंड का हाई-क्वालिटी मल्टी-कैमरा आउटपुट और स्टीरियो ऑडियो को सपोर्ट करता है, जिससे फ़िल्म, विज्ञापन, गेम आदि के लिए औद्योगिक कंटेंट प्रोडक्शन की दक्षता में बड़ा सुधार होता है
  • समग्र मूल्यांकन में उद्योग-स्तरीय शीर्ष जनरेशन क्वालिटी और प्रॉम्प्ट पालन प्रदर्शन दर्ज किया गया, और आगे चलकर सूक्ष्म स्थिरता व मल्टी-चरित्र निरंतरता में सुधार की योजना है

Seedance 2.0 अवलोकन

  • 12 फ़रवरी 2026 को जारी Seedance 2.0, ByteDance का एकीकृत मल्टीमॉडल ऑडियो-वीडियो जनरेशन मॉडल है
    • यह टेक्स्ट, इमेज, ऑडियो और वीडियो—इन चारों प्रकार के इनपुट को एक साथ प्रोसेस करता है
    • पिछले 1.5 वर्ज़न की तुलना में जनरेशन क्वालिटी, भौतिक सटीकता, यथार्थवाद और कंट्रोल—सभी में सुधार हुआ है
  • इसका लक्ष्य औद्योगिक वीडियो प्रोडक्शन है, और यह 15 सेकंड वीडियो लंबाई, मल्टी-कैमरा, स्टीरियो ऑडियो को सपोर्ट करता है
  • फ़िलहाल इसे Jjeukmong AI, Doubao(豆包) जैसे प्लेटफ़ॉर्म पर आज़माया जा सकता है

प्रमुख फीचर्स और तकनीकी विशेषताएँ

  • जटिल मूवमेंट और इंटरैक्शन में बेहतर स्थिरता
    • यह कई पात्रों की गतिविधियों और भौतिक नियमों को स्वाभाविक रूप से पुनर्निर्मित करता है
    • उदाहरण के तौर पर, दो लोगों के figure skating दृश्य में जंप, स्पिन और लैंडिंग को यथार्थवादी ढंग से दिखाता है
  • मल्टीमॉडल इनपुट का विस्तार
    • अधिकतम 9 इमेज, 3 वीडियो, 3 ऑडियो और प्राकृतिक भाषा निर्देशों का मिश्रित इनपुट
    • इनपुट सामग्री के कंपोज़िशन, मूवमेंट, कैमरा वर्क, स्पेशल इफेक्ट्स और साउंड एलिमेंट्स को प्रतिबिंबित करके आउटपुट बनाता है
  • सूक्ष्म नियंत्रण और एडिटिंग फीचर्स
    • निर्देशों के साथ निरंतरता बेहतर हुई है, और जटिल स्क्रिप्ट भी सटीक रूप से पुन:निर्मित की जा सकती हैं
    • वीडियो एक्सटेंशन और आंशिक एडिटिंग फीचर्स से दृश्य, पात्र और क्रियाओं में बदलाव किया जा सकता है
  • हाई-क्वालिटी ऑडियो जनरेशन
    • दो-चैनल स्टीरियो में बैकग्राउंड साउंड, साउंड इफेक्ट्स और नैरेशन को एक साथ जनरेट करता है
    • ASMR और wuxia दृश्यों जैसे उदाहरणों में सूक्ष्म ध्वनि टेक्सचर और विज़ुअल सिंक को लागू करता है
  • पूरे उद्योग में उपयोगिता
    • विज्ञापन, फ़िल्म, गेम, नैरेशन वीडियो आदि जैसे विविध प्रोडक्शन वातावरण के लिए उपयुक्त
    • AI के आधार पर स्पेशल इफेक्ट्स और शूटिंग लागत में कमी तथा प्रोडक्शन समय में कमी संभव

प्रदर्शन मूल्यांकन

  • वीडियो जनरेशन क्वालिटी
    • मूवमेंट स्थिरता, प्रॉम्प्ट पालन और सौंदर्यपूर्ण गुणवत्ता में उद्योग-अग्रणी स्तर
    • जटिल गतिविधियों, चेहरे के भाव और कैमरा निर्देशन को सटीकता से व्यक्त करता है
    • कुछ सूक्ष्म स्थिरता और डायनेमिक जीवंतता में अभी सुधार की आवश्यकता है
  • ऑडियो जनरेशन क्वालिटी
    • स्टीरियो साउंड की परतदार अनुभूति और दृश्य-अनुकूल ध्वनि में सुधार
    • संवाद, संगीत और साउंड इफेक्ट्स की विज़ुअल संगति बेहतर हुई है
    • कई पात्रों के लिप-सिंक और वॉइस डिस्टॉर्शन में अभी कुछ सीमाएँ हैं
  • मल्टीमॉडल रेफ़रेंस जनरेशन
    • विभिन्न इनपुट संयोजनों को समझकर उन्हें सटीक रूप से प्रतिबिंबित करता है
    • एडिटिंग और एक्सटेंशन कार्यों में उच्च निरंतरता और यथार्थवाद सुनिश्चित करता है
    • मल्टी-चरित्र निरंतरता और टेक्स्ट पुनरुत्पादन की सटीकता में अभी और सुधार की आवश्यकता है

समग्र मूल्यांकन और आगे की दिशा

  • Seedance 2.0 ने “साउंड-स्क्रीन सिंक्रोनाइज़्ड जनरेशन” से आगे बढ़कर “एकीकृत मल्टीमॉडल जनरेशन” तक प्रगति की है
  • यह भौतिक नियमों के पालन और दीर्घकालिक निरंतरता की समस्याओं को हल करते हुए क्रिएटर्स की स्वतंत्रता बढ़ाता है
  • आगे चलकर सूक्ष्म क्वालिटी स्थिरीकरण और मानव फीडबैक-आधारित alignment के माध्यम से
    इसे और अधिक कुशल और रचनात्मक AI वीडियो प्रोडक्शन टूल के रूप में विकसित किया जाएगा

3 टिप्पणियां

 
roxie 2026-02-27

असल में इस्तेमाल करके ही पता चलेगा, लेकिन होमपेज तो कमाल का है।

 
honglu 2026-02-13

आपकी पोस्ट देखकर इतना मन ललचा गया कि साइन अप तक कर लिया,

लेकिन असल में इसे मुफ्त में आज़मा ही नहीं सकते।

शायद उस मॉडल को फिलहाल छिपा दिया गया है, या फिर मुफ्त के 3 credits से तो कुछ भी नहीं किया जा सकता..... हुहू

 
xguru 2026-02-13

हाल में seedance 2.0 वीडियो के नाम से बहुत-सी चीज़ें घूमती दिख रही थीं, और अब इसे बाकायदा आधिकारिक रूप से जारी कर दिया गया है.
Hacker News पर seedance खोजने पर तरह-तरह की पेड साइटें छाई हुई दिखीं. लगता है इसमें कुछ कारोबार हो रहा है.

आधिकारिक ब्लॉग पर भी अभी सिर्फ़ चीनी भाषा में पोस्टिंग है. वहाँ वीडियो भी थोड़े ज़्यादा हैं.

https://seed.bytedance.com/en/blog/…