• SD 1.5 को ज्यों का त्यों इस्तेमाल करते हुए, img2txt की मदद से Spectrogram इमेज जनरेट करने के लिए मॉडल को fine-tune किया गया
  • बनाई गई इमेज को चलाने योग्य ऑडियो क्लिप में बदला जा सकता है
  • img2img का उपयोग करके साउंड को संशोधित किया जा सकता है
  • छोटे ऑडियो क्लिप को अनंत रूप से loop करने योग्य बनाने के लिए interpolation
  • उपयोग में आसान बनाने के लिए इसे वेबऐप के रूप में बनाया गया है और कोड भी सार्वजनिक रूप से उपलब्ध है (Next.js + React + Three.js + Tailwind)

Spectrogram : Waveform + Spectrum

  • frequency, amplitude (तीव्रता) और time का उपयोग करके ध्वनि के spectrum को visualize करके दिखाने की विधि
  • STFT(Short-Time Fourier Transform) का उपयोग करके ऑडियो से इसकी गणना की जा सकती है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.