- SD 1.5 को ज्यों का त्यों इस्तेमाल करते हुए, img2txt की मदद से Spectrogram इमेज जनरेट करने के लिए मॉडल को fine-tune किया गया
- बनाई गई इमेज को चलाने योग्य ऑडियो क्लिप में बदला जा सकता है
- img2img का उपयोग करके साउंड को संशोधित किया जा सकता है
- छोटे ऑडियो क्लिप को अनंत रूप से loop करने योग्य बनाने के लिए interpolation
- उपयोग में आसान बनाने के लिए इसे वेबऐप के रूप में बनाया गया है और कोड भी सार्वजनिक रूप से उपलब्ध है (Next.js + React + Three.js + Tailwind)
Spectrogram : Waveform + Spectrum
- frequency, amplitude (तीव्रता) और time का उपयोग करके ध्वनि के spectrum को visualize करके दिखाने की विधि
- STFT(Short-Time Fourier Transform) का उपयोग करके ऑडियो से इसकी गणना की जा सकती है
अभी कोई टिप्पणी नहीं है.