• सरल टेक्स्ट प्रॉम्प्ट से अधिकतम 47 सेकंड तक का उच्च-गुणवत्ता वाला ऑडियो डेटा जनरेट करने में सक्षम बनाता है
  • विशेष प्रशिक्षण की वजह से ड्रम बीट, इंस्ट्रूमेंट रिफ़, एम्बियंट साउंड, Foley रिकॉर्डिंग और म्यूज़िक प्रोडक्शन व साउंड डिज़ाइन के लिए अन्य ऑडियो सैंपल बनाने के लिए आदर्श
  • इस ओपन सोर्स रिलीज़ का मुख्य फ़ायदा यह है कि उपयोगकर्ता अपने कस्टम ऑडियो डेटा पर मॉडल को fine-tune कर सकते हैं
    • उदाहरण के लिए, कोई ड्रमर अपनी खुद की ड्रम रिकॉर्डिंग सैंपल पर fine-tune करके नए बीट बना सकता है
  • Stable Audio से यह कैसे अलग है?
    • कमर्शियल प्रोडक्ट Stable Audio अधिकतम 3 मिनट लंबाई तक, एकसमान म्यूज़िक स्ट्रक्चर वाले उच्च-गुणवत्ता के फुल ट्रैक, साथ ही audio-to-audio generation और एकसमान multi-part music composition जैसी उन्नत सुविधाएँ प्रदान करता है
    • दूसरी ओर, Stable Audio Open ऑडियो सैंपल, साउंड इफेक्ट्स और प्रोडक्शन एलिमेंट्स के लिए विशेष रूप से बनाया गया है
      • यह छोटे म्यूज़िक क्लिप जनरेट कर सकता है, लेकिन पूरे गाने, मेलोडी या vocals के लिए optimized नहीं है
      • यह ओपन मॉडल क्रिएटर कम्युनिटी के साथ जिम्मेदार विकास को प्राथमिकता देते हुए साउंड डिज़ाइन के लिए generative AI पर अंतर्दृष्टि प्रदान करता है
  • Stable Audio Open मॉडल weights Hugging Face पर उपलब्ध हैं
    • साउंड डिज़ाइनर, म्यूज़िशियन, डेवलपर और ऑडियो उत्साही लोगों को मॉडल डाउनलोड करने, उसकी क्षमताओं को परखने और फ़ीडबैक देने के लिए प्रोत्साहित किया गया है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.