- Spotify के AI DJ feature का classical music को सही तरह पहचानने में विफल होना AI की सीमाओं और music metadata की समस्या को उजागर करता है
- जब उपयोगकर्ता ने “Beethoven की 7वीं Symphony” चलाने को कहा, तो AI रचना की संरचना या movements के क्रम को समझ नहीं पाया और गलत movement या किसी दूसरे composer की रचना चला दी
- “सभी movements को क्रम से चलाओ” जैसे स्पष्ट निर्देश के बावजूद, AI ने गलत symphony या उलटे-सीधे क्रम में मिली-जुली recordings चुनीं और असंगत नतीजे दिए
- इन त्रुटियों की जड़ यह है कि digital music metadata को pop music-केंद्रित तरीके से डिज़ाइन किया गया है, इसलिए वह composer, work और movement जैसे विचारों को ठीक से दर्शा नहीं पाता
- लेख AI की “intelligence” को लेकर उम्मीदों और वास्तविकता के बीच की दूरी दिखाता है, और अंत में पश्चिमी संगीत परंपरा का संरक्षण corporate profit से असंबंधित है जैसी एक निंदक निष्कर्ष पर पहुँचता है
AI DJ के उपयोग का अनुभव और समस्या की पहचान
- लेख “क्या AI सचमुच बुद्धिमान है?” इस सवाल से शुरू होता है और यह मुद्दा उठाता है कि AI की गलतियों की ज़िम्मेदारी programmers की है या नहीं
- Spotify app के AI DJ feature का इस्तेमाल कर classical music खोजने की कोशिश की जाती है, और इससे Spotify के मौजूदा search structure की सीमाएँ फिर सामने आती हैं
- लेखक pop music नहीं, बल्कि 500 वर्षों की पश्चिमी संगीत परंपरा सुनने वाले श्रोता के रूप में Tallis से Shaw तक के composers का उदाहरण देता है
digital music metadata की संरचनात्मक सीमाएँ
- digital music files का metadata Artist, Album, Song इन तीन tags से बना होता है, और यह pop music-केंद्रित डिज़ाइन है
- लेखक बताता है कि “Song” शब्द का वाद्य संगीत पर भी इस्तेमाल होना एक अनुचित अभिव्यक्ति है, और classical music में “composition” या “work” अधिक उपयुक्त है
- classical music की मूल संरचना ‘movement’ metadata में शामिल नहीं है, इसलिए Spotify किसी रचना की पूरी संरचना को पहचान नहीं पाता
Beethoven की 7वीं Symphony चलाने का प्रयोग
- “Play Beethoven’s 7th Symphony” कमांड पर AI केवल दूसरा movement Allegretto चलाता है और उसके बाद पूरी तरह असंबंधित रचनाएँ बजाने लगता है
- “Play Beethoven’s 7th Symphony in its entirety” कहने पर भी AI इसे गलत तरीके से “9 मिनट की पूरी रचना” समझता है और फिर सिर्फ दूसरा movement चलाता है
- “Play Beethoven’s 7th Symphony from beginning to end” कमांड पर भी वही होता है: सिर्फ दूसरा movement बजता है, फिर John Field की रचना पर चला जाता है
- “Play all four movements” कहने पर पहले movement से शुरू तो करता है, लेकिन अलग-अलग orchestras की recordings मिलाकर क्रम बिगाड़ देता है
- “Play all four movements in numerical order” कमांड पर तो यह तीसरी Symphony के पहले movement से शुरू करता है, यानी पूरी तरह गलत परिणाम देता है
संगीत की समझ में AI की कमी
- लेख बताता है कि AI किसी रचना की movement संरचना या क्रम की अवधारणा को बिल्कुल नहीं समझता
- Beethoven की symphonies में चार movements होते हैं, यह बात Wikipedia की पहली पंक्ति पढ़कर भी समझी जा सकती है, फिर भी AI इसे लागू नहीं कर पाता
- लेखक इस गलती की तुलना audiobook का आख़िरी chapter पहले पढ़ने से करता है और AI की अज्ञानता पर व्यंग्य करता है
निष्कर्ष: AI और संगीत परंपरा के बीच टूटन
- लेख इस दावे पर संदेह जताता है कि AI संगीत “compose” कर सकता है, और मूलभूत अवधारणाएँ तक न समझने वाला AI सृजन की बात नहीं कर सकता कहकर आलोचना करता है
- Spotify DJ अभी beta stage में है, यह मानने के बावजूद लेखक अंत में कंपनियों के पास पश्चिमी संगीत परंपरा को संरक्षित करने की कोई प्रेरणा नहीं है जैसी यथार्थवादी निराशा के साथ बात समाप्त करता है
- कुल मिलाकर इसे AI तकनीक की सीमाएँ, metadata design का पक्षपात, और सांस्कृतिक उदासीनता—इन सबके मिलेजुले संकट के रूप में पेश किया गया है
1 टिप्पणियां
Hacker News टिप्पणियाँ
यह AI की समस्या नहीं, बल्कि product design की समस्या है। Spotify DJ असल में लगभग “shuffle + voice comments” स्तर का है, और संभव है कि पूरे album को चलने से जानबूझकर रोकने वाला code मौजूद हो
AI को एक ही अवधारणा मानकर सामान्यीकृत करना गलत तरीका है। “अगर यह फीचर काम नहीं करता तो AI बेकार है” जैसी दलील category error के अंतर्गत आती है
पूरा लेख कई तरह की रायों को मिलाकर उलझा हुआ है, और उसका आधा हिस्सा सिर्फ classical रचनाओं के नाम गिनाने जैसा है। Spotify DJ खराब है, इस बात से सहमत हूँ, लेकिन यह आलोचना करने का प्रभावी तरीका नहीं है
तकनीक की ताकत और सीमाओं को समझने की कोई कोशिश नहीं है, और यह एक संकरे उदाहरण से पूरे AI को खारिज करने वाला सामान्य पैटर्न है। AI इंसान नहीं है, इसलिए उसकी सीमाएँ होना स्वाभाविक है
AI coding assistants में भी ऐसा ही देखा है। लोग security समस्याओं का हवाला देकर उसे पूरी तरह नकार देते हैं, लेकिन “एक वाक्य में native Mac app बनाने” की संभावना को नज़रअंदाज़ कर देते हैं
Hör Berlin जैसे YouTube DJ mix की खासियत DJ का चयन, उसकी व्याख्या, और उसकी सांस्कृतिक पृष्ठभूमि है। AI अगर सिर्फ optimized list निकालता है, तो वह इस मूल सार को खो देता है
Spotify लागत घटाने के लिए radio-type और interactive-type licenses को मिलाकर इस्तेमाल करता है। AI द्वारा बनाई गई playlist उपयोगकर्ता की सीधी पसंद नहीं मानी जाती, इसलिए संभव है उसे radio-type के रूप में treat किया जाए
मैं dublab, NTS1, NTS2 जैसे broadcasts सुनना पसंद करता हूँ, क्योंकि वहाँ अप्रत्याशित संगीत सुनने को मिलता है
अरबों डॉलर खर्च करने पर भी perfect recommendation संभव नहीं हुई, और यह human DJ के social proof की जगह नहीं ले सकी
यह भी खटका कि जैसे संगीत में सिर्फ pop और Western classical ही सब कुछ हों
मैं इसे prompt design की विफलता मानता हूँ। वही अनुरोध ChatGPT उदाहरण में जाँचें, तो AI सही प्रतिक्रिया देता है
यानी या तो Spotify का model कमजोर है, या internal prompt गलत दिशा में ले जा रहा था
“AI संगीत compose नहीं कर सकता” वाला दावा भी गलत तुलना है। AI पहले ही music theory की समझ और composition की संभावना दिखा चुका है। अंततः बात quality और taste की है
लोग हर बार LLM को “AI” कहते हैं, तो धारणा विकृत होती है।
यह marketing industry की सबसे बड़ी सफलताओं में से एक है, और दुनिया को पहुँचाए गए सबसे बड़े नुकसानों में भी एक है