1. परिचय

नमस्ते।
मैं वही इंडी डेवलपर हूँ जिसने पिछली बार eBook रीडर (Folio) का परिचय कराया था।

वीडियो एडिटिंग करते समय कई बार बिना chroma key के बैकग्राउंड हटाने की ज़रूरत पड़ती है,
या संगीत में सिर्फ vocals या सिर्फ किसी खास वाद्य को निकालना होता है।
इसी सोच के साथ कि एक ही टूल में बैकग्राउंड रिमूवल और ऑडियो सेपरेशन दोनों हल किए जाएँ, मैंने इसे खुद बनाया।


2. सेवा का एक-पंक्ति सार

AlphaClip एक डेस्कटॉप ऐप है जो वीडियो में AI से बैकग्राउंड अपने-आप हटाता है, और ऑडियो को अलग-अलग ट्रैक्स (vocals, drums, bass, guitar आदि) में विभाजित कर सकता है।


3. सेवा परिचय

AlphaClip (Habom) वीडियो पोस्ट-प्रोसेसिंग पर केंद्रित एक AI टूल है।

  • वीडियो से AI द्वारा बैकग्राउंड अपने-आप हटाना (सफेद या काले बैकग्राउंड की सिफारिश)
  • ऑडियो को अलग-अलग ट्रैक्स (vocals, drums, bass, guitar आदि) में विभाजित करना
  • chroma key उपकरण के बिना भी साफ-सुथरा बैकग्राउंड रिमूवल
  • After Effects के बैकग्राउंड रिमूवल फीचर को और आसान तरीके से ऑटोमेट करना

इसे कैरेक्टर वीडियो निर्माण, म्यूज़िक एडिटिंग और वीडियो पोस्ट-प्रोसेसिंग के लिए उपयोग किया जा सकता है।


4. प्रमुख फीचर्स

🎬 वीडियो बैकग्राउंड रिमूवल

  • AI-आधारित ऑटोमैटिक बैकग्राउंड रिमूवल
  • chroma key के बिना सिर्फ subject को निकालना
  • GPU(CUDA) acceleration सपोर्ट से बेहतर प्रोसेसिंग स्पीड

🎵 ऑडियो सेपरेशन

  • vocals / drums / bass / guitar आदि अलग-अलग ट्रैक्स निकालना
  • संगीत से मनचाहा वाद्य अलग किया जा सकता है

🎞️ कैरेक्टर वीडियो जनरेशन

  • AI का उपयोग करके अंतिम कैरेक्टर वीडियो बनाना

5. टेक स्टैक

  • Python (vibe coding-आधारित डेवलपमेंट)
  • CUDA (GPU acceleration)
  • AI मॉडल (बैकग्राउंड रिमूवल / ऑडियो सेपरेशन)

6. डेवलपमेंट के दौरान चुनौतियाँ

  • CUDA सेटिंग्स के ज़रिए GPU उपयोग का optimization
  • बैकग्राउंड रिमूवल क्वालिटी और प्रोसेसिंग स्पीड के बीच संतुलन
  • vibe coding के साथ डेवलपमेंट के पहले हफ्ते में बचे हुए errors को संभालना

7. वर्तमान स्थिति

  • vibe coding के साथ लगभग 1 हफ्ते से डेवलपमेंट जारी
  • अभी फीचर इम्प्लीमेंटेशन पर केंद्रित काम चल रहा है, और कुछ errors बाकी हैं
  • फिलहाल इसे मुफ्त में जारी करने और सुधारने की योजना है
  • आगे चलकर tarot card ऐप के लिए animated characters और backgrounds (78 कार्ड) बनाने में इसका उपयोग करने की योजना है
  • छोटे-छोटे प्रोजेक्ट्स को जोड़कर एक automation pipeline बनाना अंतिम लक्ष्य है

इस समय 2~4 काम एक साथ चल रहे हैं, इसलिए लगता है कि थोड़ा selection और focus की ज़रूरत है!
संक्षेप में कहूँ तो,

  1. RVC, आसान शब्दों में speech-to-speech training/inference का उपयोग करके कैरेक्टर आवाज़ बदलना
  2. नीचे दिया गया market पेज भी लगभग 1 महीने में बनाकर payment तक पूरा किया, लेकिन इसमें लगातार सुधार का काम जारी रहेगा
  3. ऐप notification management tool (APNs/FCM), funnel analysis tool (google analytics जैसा)

इसके अलावा भी और चीज़ें हैं, लेकिन समय लगे तो भी मैं उन्हें एक-एक करके धीरे-धीरे परिचित कराऊँगा!!


8. अपेक्षाएँ?

  • वास्तविक यूज़र फीडबैक (error reports का स्वागत है!! वीडियो या SNS के जरिए कभी भी भेज सकते हैं!)
  • वीडियो एडिटिंग workflow पर राय

अगर कोई कमी या सुधार का आइडिया हो तो बेझिझक बताइए!
उम्मीद है आप वीडियो का आनंद लेंगे!


मैंने इस प्रोग्राम का इस्तेमाल करके नीचे दिया गया वीडियो बनाया है, कृपया मज़े से(?) देखें :)

Demo वीडियो

https://www.youtube.com/watch?v=lZhiMreW94Q

  • वीडियो में CPU/GPU monitoring करने वाला टूल भी मैंने market में साथ में अपलोड किया है!!
    (इसे alphaclip Habom tools बनाते समय आराम के दौरान(?) सिर्फ 30 मिनट से 1 घंटे में बनाया था!!)

⬇️ डाउनलोड लिंक
📥 डाउनलोड: https://market.habom.kr

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.