• Google Research द्वारा प्रकाशित पेपर
  • टेक्स्ट विवरण के प्रति बेहद वफादार संगीत जनरेट करता है: "distortion लगी guitar riff के साथ शांत violin melody"
  • hierarchical sequence-to-sequence modeling कार्य के रूप में कास्ट करके कई मिनट लंबा 24kHz संगीत जनरेट करता है
  • मौजूदा सिस्टम्स की तुलना में sound quality और टेक्स्ट विवरण का पालन, दोनों में कहीं बेहतर
  • whistle या humming जैसी melody styles को भी रूपांतरित किया जा सकता है
  • कई prompts को क्रम से देकर story mode में audio जनरेट किया जा सकता है
  • 5.5k music-text pairs से बने MusicCaps dataset को जारी किया गया

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.