- सरल टेक्स्ट प्रॉम्प्ट से अधिकतम 47 सेकंड तक का उच्च-गुणवत्ता वाला ऑडियो डेटा जनरेट करने में सक्षम बनाता है
- विशेष प्रशिक्षण की वजह से ड्रम बीट, इंस्ट्रूमेंट रिफ़, एम्बियंट साउंड, Foley रिकॉर्डिंग और म्यूज़िक प्रोडक्शन व साउंड डिज़ाइन के लिए अन्य ऑडियो सैंपल बनाने के लिए आदर्श
- इस ओपन सोर्स रिलीज़ का मुख्य फ़ायदा यह है कि उपयोगकर्ता अपने कस्टम ऑडियो डेटा पर मॉडल को fine-tune कर सकते हैं
- उदाहरण के लिए, कोई ड्रमर अपनी खुद की ड्रम रिकॉर्डिंग सैंपल पर fine-tune करके नए बीट बना सकता है
- Stable Audio से यह कैसे अलग है?
- कमर्शियल प्रोडक्ट Stable Audio अधिकतम 3 मिनट लंबाई तक, एकसमान म्यूज़िक स्ट्रक्चर वाले उच्च-गुणवत्ता के फुल ट्रैक, साथ ही audio-to-audio generation और एकसमान multi-part music composition जैसी उन्नत सुविधाएँ प्रदान करता है
- दूसरी ओर, Stable Audio Open ऑडियो सैंपल, साउंड इफेक्ट्स और प्रोडक्शन एलिमेंट्स के लिए विशेष रूप से बनाया गया है
- यह छोटे म्यूज़िक क्लिप जनरेट कर सकता है, लेकिन पूरे गाने, मेलोडी या vocals के लिए optimized नहीं है
- यह ओपन मॉडल क्रिएटर कम्युनिटी के साथ जिम्मेदार विकास को प्राथमिकता देते हुए साउंड डिज़ाइन के लिए generative AI पर अंतर्दृष्टि प्रदान करता है
- Stable Audio Open मॉडल weights Hugging Face पर उपलब्ध हैं
- साउंड डिज़ाइनर, म्यूज़िशियन, डेवलपर और ऑडियो उत्साही लोगों को मॉडल डाउनलोड करने, उसकी क्षमताओं को परखने और फ़ीडबैक देने के लिए प्रोत्साहित किया गया है
अभी कोई टिप्पणी नहीं है.