- Sora एक AI मॉडल है जो टेक्स्ट निर्देशों के आधार पर यथार्थवादी और कल्पनाशील दृश्य बना सकता है
- यह उपयोगकर्ता के prompt के प्रति वफादार रहते हुए visual quality बनाए रखता है और अधिकतम 1 मिनट लंबा वीडियो बना सकता है
- विभिन्न prompts के आधार पर बनाए गए वीडियो उदाहरण प्रस्तुत किए गए हैं, जो विस्तृत scenarios देते हैं
- इस पेज के सभी वीडियो सीधे Sora द्वारा बनाए गए हैं और इनमें कोई संपादन नहीं किया गया है
- फिलहाल Sora को जोखिम मूल्यांकन के लिए 'red team' को दिया गया है, और visual artists, designers, तथा filmmakers से feedback लिया जा रहा है
- OpenAI अपने research progress को साझा करके बाहरी लोगों से feedback लेना चाहता है और AI capabilities के भविष्य को जनता के सामने दिखाना चाहता है
Sora की क्षमताएँ
- यह जटिल दृश्य, कई characters, विशिष्ट movements, और विषय व background की सटीक details बना सकता है
- यह केवल उपयोगकर्ता के prompt ही नहीं, बल्कि भौतिक दुनिया में चीजें कैसे मौजूद होती हैं, इसे भी समझता है
Sora की सुरक्षा
- OpenAI, Sora को अपने products में integrate करने से पहले कई safety measures अपनाने वाला है
- इनमें भ्रामक content का पता लगाने वाले tools का विकास, और यह पहचानने के लिए classifier बनाना शामिल है कि कोई वीडियो Sora द्वारा बनाया गया है या नहीं
शोध तकनीक
- Sora एक diffusion model है जो शोर से भरे वीडियो से शुरू होकर धीरे-धीरे noise हटाते हुए वीडियो बनाता है
- यह GPT models जैसी transformer architecture का उपयोग करता है, जो बेहतरीन scaling performance प्रदान करती है
GN⁺ की राय
- Sora टेक्स्ट-आधारित निर्देशों से वीडियो बनाने वाली एक अभिनव AI तकनीक है, जो creative professionals के लिए नई संभावनाएँ खोलती है
- safety measures और feedback के जरिए यह वास्तविक दुनिया में उपयोग से सीखने और AI systems को क्रमिक रूप से सुरक्षित बनाने में महत्वपूर्ण भूमिका निभाता है
- यह तकनीक भविष्य में AGI (Artificial General Intelligence) हासिल करने की दिशा में एक महत्वपूर्ण milestone साबित हो सकती है
6 टिप्पणियां
सच में बस हैरानी ही निकल रही है।
7 ट्रिलियन मिलेंगे क्या...?
ऊपरी तौर पर देखने पर यह समझना मुश्किल है कि यह असली वीडियो है या AI द्वारा बनाया गया वीडियो।
वाह... मैं इसे जल्दी आज़माना चाहता/चाहती हूँ.
डिफ्यूज़न मॉडल का मतलब क्या stable diffusion जैसी ही विधि है?
लगता है stock photo या stock video मार्केट के लिए मुश्किल समय आने वाला है..
जनरेशन क्वालिटी वाकई कमाल की है। क्या यह इतनी तेजी से आगे बढ़ रहा है?
Hacker News राय