30 पॉइंट द्वारा GN⁺ 2024-08-11 | 4 टिप्पणियां | WhatsApp पर शेयर करें
  • अत्याधुनिक AI तकनीक का उपयोग करके केवल एक इमेज से वन-क्लिक रियल-टाइम फेस स्वैप सपोर्ट (डीपफेक वीडियो)
  • मल्टी-प्लेटफ़ॉर्म: CPU, NVIDIA CUDA, Apple Silicon(M1/M2) सपोर्ट
  • बिल्ट-इन जांच फीचर के साथ अनुचित कंटेंट प्रोसेसिंग को रोकता है और वैध व नैतिक उपयोग सुनिश्चित करता है
  • Python ओपन सोर्स
  • उपयोग के चरण
    1. आवश्यक environment सेट करें (python, pip, ffmpeg)
    2. GitHub repository clone करें
    3. आवश्यक model डाउनलोड करें (GFPGANv1.4, inswapper_128_fp16.onnx)
    4. dependencies इंस्टॉल करें (venv का उपयोग: CUDA, CoreML, DirectML, OpenVINO)
    5. प्रोग्राम चलाएं
    6. source image और target चुनें
    7. फेस स्वैप प्रोसेसिंग शुरू करें

Deep Live Cam की मुख्य विशेषताएँ

  • रियल-टाइम फेस स्वैप: एक सिंगल इमेज का उपयोग करके रियल-टाइम में चेहरे बदले जा सकते हैं, और तुरंत प्रीव्यू फीचर मिलता है
  • वन-क्लिक वीडियो डीपफेक: आसान संचालन के साथ उच्च-गुणवत्ता वाले डीपफेक वीडियो तेज़ी और आसानी से बनाए जा सकते हैं
  • मल्टी-प्लेटफ़ॉर्म सपोर्ट: CPU, NVIDIA CUDA, Apple Silicon जैसे विभिन्न हार्डवेयर सेटअप पर चलाया जा सकता है
  • नैतिक उपयोग के सुरक्षा उपाय: अनुचित कंटेंट प्रोसेसिंग को रोकने वाली बिल्ट-इन जांच सुविधा के माध्यम से कानूनी और नैतिक उपयोग सुनिश्चित करता है
  • ऑप्टिमाइज़्ड परफ़ॉर्मेंस: ऑप्टिमाइज़्ड एल्गोरिद्म का उपयोग करके, खासकर CUDA-सपोर्टेड NVIDIA GPU पर प्रोसेसिंग स्पीड में बड़ा सुधार होता है

# GN⁺ का सारांश

  • Deep Live Cam रियल-टाइम फेस स्वैप और वीडियो डीपफेक के लिए एक अत्याधुनिक AI टूल है, जो विभिन्न प्लेटफ़ॉर्म पर चल सकता है
  • नैतिक उपयोग सुनिश्चित करने के लिए इसमें सुरक्षा उपाय बिल्ट-इन हैं, और इसे ओपन सोर्स कम्युनिटी का लगातार समर्थन मिलता है
  • यह टूल क्रिएटिव प्रोजेक्ट्स और वीडियो प्रोडक्शन के लिए उपयोगी है, खासकर जब तेज़ी से उच्च-गुणवत्ता वाले विज़ुअल परिणाम चाहिए हों
  • समान फीचर देने वाले अन्य प्रोजेक्ट्स में DeepFaceLab और FaceSwap शामिल हैं

4 टिप्पणियां

 
dongwon 2024-08-13

मैंने इसे खुद लागू करके देखा; इसे पूरी तरह अलग न कर पाना संभव नहीं है, लेकिन सिर्फ एक असली image से भी यह स्तर संभव है...? ऐसा लगा। उम्रदराज़ लोग तो सच में आसानी से धोखा खा सकते हैं, इसलिए यह ऐसा दौर लगता है जहाँ समझ नहीं आता कि किस पर भरोसा करें।

 
xguru 2024-08-12

सिर्फ एक इमेज से किया गया है, इस हिसाब से नतीजा शानदार है। अब लगता है कि वीडियो पर सच में भरोसा नहीं किया जा सकेगा।

 
GN⁺ 2024-08-11
Hacker News राय
  • "नैतिक उपयोग सुरक्षा उपाय" अनुचित कंटेंट प्रोसेसिंग को रोकते हैं

    • इसमें मशहूर हस्तियों और राजनेताओं (JD Vance सहित) की नकल के उदाहरण हैं
    • 'नैतिक' deepfake की परिभाषा अस्पष्ट है
    • AI से बनाई जा सकने वाली इतनी सारी चीज़ों में से आखिर यही क्यों चुना गया, यह सवाल है
  • तकनीकी रूप से इसकी गुणवत्ता चौंकाने वाली है

    • अब लगभग हर script kiddie रियल-टाइम वीडियो कॉल में चेहरा deepfake कर सकता है
    • वीडियो कॉल में अपनी आंखों से जो दिखे, उस पर अब भरोसा नहीं किया जा सकता
    • हम दिलचस्प समय में जी रहे हैं
  • यह प्रोजेक्ट "GFPGAN v1.4" और "FaceSwap Extension - Automatic 1111 - Proof of Concept" पर आधारित है

    • GFPGAN प्रोजेक्ट Wang आदि द्वारा लिखे गए पेपर "GFP-GAN: Towards Real-World Blind Face Restoration with Generative Facial Prior" पर आधारित है
  • यह प्रोजेक्ट बंद हो चुके roop का एक fork लगता है और इसमें मुख्यतः UI सुधार हैं

    • roop के मुख्य डेवलपर्स में से एक facefusion विकसित कर रहा है, जो रियल-टाइम webcam face swap को सपोर्ट करता है
  • तकनीकी रूप से प्रभावशाली है, लेकिन प्रचार या धोखाधड़ी से जुड़ा न हो ऐसा अच्छा use case खोजना कठिन है

    • वेबसाइट पर भी कोई स्पष्ट use case नहीं दिया गया है
  • अगर voice enhancement जोड़ दिया जाए, तो हर दादा-दादी का बैंक खाता खाली हो सकता है

    • अभी तुरंत चेतावनी देनी चाहिए
  • संदेह है कि इस तकनीक का कोई वैध use case है भी या नहीं

    • यह जानने की जिज्ञासा है कि प्रोडक्ट की कल्पना करते समय किस persona/vertical market को लक्ष्य बनाया गया था
  • "बिल्ट-इन चेक फ़ंक्शन अनुचित कंटेंट प्रोसेसिंग को रोकता है, जिससे कानूनी और नैतिक उपयोग सुनिश्चित होता है"

    • software engineer बस यही उम्मीद करते हैं कि बंदूक मेज़ से कूदकर किसी को गोली न मार दे
  • हम शायद उस बिंदु पर पहुंच चुके हैं जहां केवल वही multimedia भरोसेमंद है जिसे विश्वसनीय स्रोतों से cross-verify किया गया हो

    • सोचने वाली बात है कि क्या कैमरा digital signature जोड़ सकता है ताकि यह दिखाया जा सके कि वीडियो/फोटो असली है
    • AI फोटो/वीडियो टैग की तुलना में non-AI फोटो/वीडियो टैग अधिक व्यावहारिक लगते हैं
  • इस टूल की रिलीज़ का समय बेहद अनुचित लगता है

    • इससे इस साल के अमेरिकी चुनाव प्रभावित हो सकते हैं
    • चुनावों पर इस तकनीक के असर को ही देखें तो भी यह अच्छा नहीं है
    • child pornography, terrorism, सरकारी अस्थिरता, गृहयुद्ध/विश्व युद्ध जैसी कई समस्याएं पैदा हो सकती हैं
 
cosine20 2024-08-13

"सॉफ्टवेयर इंजीनियर बस यही उम्मीद करता है कि बंदूक मेज़ से कूदकर किसी को गोली न मार दे" hahaha