9 पॉइंट द्वारा GN⁺ 2024-04-05 | 3 टिप्पणियां | WhatsApp पर शेयर करें

3 टिप्पणियां

 
kyunghoon 2024-04-06

अब AI के गाए हुए कोरियाई गाने भी बिल्कुल अटपटे नहीं लगते।
https://www.youtube.com/watch?v=P5g5XGmhxOo

 
xguru 2024-04-05

मैंने हाल ही में Suno से बने कुछ गाने सुने, और यह कोरियाई बोलों के साथ भी उन्हें बेहद शानदार तरीके से बना देता है.

 
GN⁺ 2024-04-05
Hacker News की राय
  • वॉइस सिंथेसाइज़र, TTS सिस्टम, और सामान्य NLP में रुचि बढ़ने की वजह से ही मैंने कंप्यूटर साइंस और computational linguistics पढ़ना शुरू किया था। ये तकनीकें मेरे यूनिवर्सिटी दिनों के उन असंभव लगने वाले वैज्ञानिक सपनों जैसी थीं, और आज इस क्षेत्र की प्रगति की रफ्तार देखकर हैरानी होती है। suno.ai रोबोट की तरह टूटती-कटती आवाज़ की भी नकल कर सकता है।
  • मैंने देखा कि suno.ai कुछ शब्दों का उच्चारण मज़ेदार तरीके से बिगाड़ देता है। उदाहरण के लिए, "sublicence" को "sublissence", "fitness" को "fisted", "infringement" को "infring-ment", और "liable" को "liar-ful" की तरह बोलता है। साथ ही, आवाज़ में pitch transitions ऐसे लगते हैं जैसे auto-tuned या इलेक्ट्रॉनिक बना दिए गए हों। लगता है आगे चलकर AI-generated vocals पहचानने वाले विशेषज्ञ भी होंगे।
  • "software" शब्द का उच्चारण मज़ेदार था।
  • GPT4 के बाद AI ने मुझे इस तरह हैरान नहीं किया था। मैं प्रोफेशनल संगीतकार नहीं हूँ, लेकिन non-musicians को Suno.ai ज़रूर आज़माना चाहिए। यह तकनीक music subscription services का विकल्प बन सकती है, और professionals के लिए झटका भी साबित हो सकती है।
  • इस चर्चा में फोकस वॉइस सिंथेसिस पर है। दूसरे कमेंटर्स पहले ही अहम बातें कह चुके हैं, इसलिए मैं उन्हें दोहराऊँगा नहीं। संगीत के लिहाज़ से देखें तो यह अभी भी सच में दिलचस्प चीज़ें बनाने से काफ़ी दूर है। harmony, tempo, structure, dynamics—सब कुछ बिखरा हुआ और बिना संरचना का लगता है। सिर्फ़ pure generative models से इससे ऊँचे स्तर तक पहुँचना मुश्किल लग रहा है। शायद rules-based और generative approaches का मिश्रण चाहिए होगा।
  • Claude Sonnet ने जो गीत compose किया था, उसे मैंने Suno में एडिट किया, और स्टाइल पूरी तरह फिट नहीं होने के बावजूद नतीजा काफ़ी अच्छा निकला।
  • Dune के "Terror Song" को मैंने Bing Chat की मदद से code complexity से लड़ने वाली थीम में फिर से लिखा, और फिर suno.ai के जरिए उसे ऐसे 2 मिनट के गाने में बदला जो simplification की ज़रूरत वाले code के प्रति भावनाएँ व्यक्त करता है।
  • मुझे पढ़ते समय मन ही मन फुसफुसाने की आदत है, और जब कोई गाना दिमाग में अटका होता है तो एक अजीब-सी पसंद के तहत मैं कल्पना करता हूँ कि जो शब्द मैं पढ़ रहा हूँ, कोई उन्हें उसी गाने की melody पर गा रहा है।
  • लड़की इसलिए उदास है क्योंकि उसे उन लोगों या कलाकारों के नाम नहीं पता जिनके आधार पर संगीत और आवाज़ को मॉडल किया गया है।
  • लाइसेंस से तुकबंदी निकाल लेने वाली बात प्रभावशाली लगी।