1 पॉइंट द्वारा GN⁺ 2026-03-16 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Spotify के AI DJ feature का classical music को सही तरह पहचानने में विफल होना AI की सीमाओं और music metadata की समस्या को उजागर करता है
  • जब उपयोगकर्ता ने “Beethoven की 7वीं Symphony” चलाने को कहा, तो AI रचना की संरचना या movements के क्रम को समझ नहीं पाया और गलत movement या किसी दूसरे composer की रचना चला दी
  • “सभी movements को क्रम से चलाओ” जैसे स्पष्ट निर्देश के बावजूद, AI ने गलत symphony या उलटे-सीधे क्रम में मिली-जुली recordings चुनीं और असंगत नतीजे दिए
  • इन त्रुटियों की जड़ यह है कि digital music metadata को pop music-केंद्रित तरीके से डिज़ाइन किया गया है, इसलिए वह composer, work और movement जैसे विचारों को ठीक से दर्शा नहीं पाता
  • लेख AI की “intelligence” को लेकर उम्मीदों और वास्तविकता के बीच की दूरी दिखाता है, और अंत में पश्चिमी संगीत परंपरा का संरक्षण corporate profit से असंबंधित है जैसी एक निंदक निष्कर्ष पर पहुँचता है

AI DJ के उपयोग का अनुभव और समस्या की पहचान

  • लेख “क्या AI सचमुच बुद्धिमान है?” इस सवाल से शुरू होता है और यह मुद्दा उठाता है कि AI की गलतियों की ज़िम्मेदारी programmers की है या नहीं
  • Spotify app के AI DJ feature का इस्तेमाल कर classical music खोजने की कोशिश की जाती है, और इससे Spotify के मौजूदा search structure की सीमाएँ फिर सामने आती हैं
  • लेखक pop music नहीं, बल्कि 500 वर्षों की पश्चिमी संगीत परंपरा सुनने वाले श्रोता के रूप में Tallis से Shaw तक के composers का उदाहरण देता है

digital music metadata की संरचनात्मक सीमाएँ

  • digital music files का metadata Artist, Album, Song इन तीन tags से बना होता है, और यह pop music-केंद्रित डिज़ाइन है
  • लेखक बताता है कि “Song” शब्द का वाद्य संगीत पर भी इस्तेमाल होना एक अनुचित अभिव्यक्ति है, और classical music में “composition” या “work” अधिक उपयुक्त है
  • classical music की मूल संरचना ‘movement’ metadata में शामिल नहीं है, इसलिए Spotify किसी रचना की पूरी संरचना को पहचान नहीं पाता

Beethoven की 7वीं Symphony चलाने का प्रयोग

  • “Play Beethoven’s 7th Symphony” कमांड पर AI केवल दूसरा movement Allegretto चलाता है और उसके बाद पूरी तरह असंबंधित रचनाएँ बजाने लगता है
  • “Play Beethoven’s 7th Symphony in its entirety” कहने पर भी AI इसे गलत तरीके से “9 मिनट की पूरी रचना” समझता है और फिर सिर्फ दूसरा movement चलाता है
  • “Play Beethoven’s 7th Symphony from beginning to end” कमांड पर भी वही होता है: सिर्फ दूसरा movement बजता है, फिर John Field की रचना पर चला जाता है
  • “Play all four movements” कहने पर पहले movement से शुरू तो करता है, लेकिन अलग-अलग orchestras की recordings मिलाकर क्रम बिगाड़ देता है
  • “Play all four movements in numerical order” कमांड पर तो यह तीसरी Symphony के पहले movement से शुरू करता है, यानी पूरी तरह गलत परिणाम देता है

संगीत की समझ में AI की कमी

  • लेख बताता है कि AI किसी रचना की movement संरचना या क्रम की अवधारणा को बिल्कुल नहीं समझता
  • Beethoven की symphonies में चार movements होते हैं, यह बात Wikipedia की पहली पंक्ति पढ़कर भी समझी जा सकती है, फिर भी AI इसे लागू नहीं कर पाता
  • लेखक इस गलती की तुलना audiobook का आख़िरी chapter पहले पढ़ने से करता है और AI की अज्ञानता पर व्यंग्य करता है

निष्कर्ष: AI और संगीत परंपरा के बीच टूटन

  • लेख इस दावे पर संदेह जताता है कि AI संगीत “compose” कर सकता है, और मूलभूत अवधारणाएँ तक न समझने वाला AI सृजन की बात नहीं कर सकता कहकर आलोचना करता है
  • Spotify DJ अभी beta stage में है, यह मानने के बावजूद लेखक अंत में कंपनियों के पास पश्चिमी संगीत परंपरा को संरक्षित करने की कोई प्रेरणा नहीं है जैसी यथार्थवादी निराशा के साथ बात समाप्त करता है
  • कुल मिलाकर इसे AI तकनीक की सीमाएँ, metadata design का पक्षपात, और सांस्कृतिक उदासीनता—इन सबके मिलेजुले संकट के रूप में पेश किया गया है

1 टिप्पणियां

 
GN⁺ 2026-03-16
Hacker News टिप्पणियाँ
  • लगा कि लेखक ने तकनीकी पृष्ठभूमि होने के बावजूद अजीब लेख लिखा है
    यह AI की समस्या नहीं, बल्कि product design की समस्या है। Spotify DJ असल में लगभग “shuffle + voice comments” स्तर का है, और संभव है कि पूरे album को चलने से जानबूझकर रोकने वाला code मौजूद हो
    AI को एक ही अवधारणा मानकर सामान्यीकृत करना गलत तरीका है। “अगर यह फीचर काम नहीं करता तो AI बेकार है” जैसी दलील category error के अंतर्गत आती है
    पूरा लेख कई तरह की रायों को मिलाकर उलझा हुआ है, और उसका आधा हिस्सा सिर्फ classical रचनाओं के नाम गिनाने जैसा है। Spotify DJ खराब है, इस बात से सहमत हूँ, लेकिन यह आलोचना करने का प्रभावी तरीका नहीं है
    • Charles Petzold सिर्फ कोई साधारण तकनीकी व्यक्ति नहीं हैं, बल्कि Win32 और MFC की मानक पुस्तकों के लेखक हैं। उन्हें सिर्फ “तकनीकी व्यक्ति” कहना वैसा है जैसे Donald Knuth को “शिक्षक” कहना
    • Spotify का product organization बेहद अक्षम है। Desktop और mobile app की सुविधाएँ अलग-अलग हैं, और CarPlay में साधारण काम भी सीधे फोन से करना कहीं तेज़ है
    • लगता है लेखक ने जानबूझकर ragebait किया है। “AI संगीत compose नहीं कर सकता” वाली दलील उतनी ही बेतुकी है जितना यह कहना कि “LLM R की संख्या नहीं गिन सकता, इसलिए वह व्याकरणिक रूप से सही वाक्य नहीं बना सकता”
    • मैं इसे उल्टा देखता हूँ। तकनीकी रूप से यह पूरी तरह संभव होने के बावजूद ऐसा नतीजा आना इस बात को अच्छी तरह दिखाता है कि “इसके लिए कोई बहाना नहीं है”
    • इसे “category error” कहने से ज़्यादा begging the question कहना सही होगा। इसमें DJ फीचर और composition क्षमता को एक ही स्तर पर रखकर निष्कर्ष पहले से मान लिया गया है
  • मैंने खुद AI DJ इस्तेमाल नहीं किया, लेकिन लेखक की आलोचना से सहमत होना कठिन है
    तकनीक की ताकत और सीमाओं को समझने की कोई कोशिश नहीं है, और यह एक संकरे उदाहरण से पूरे AI को खारिज करने वाला सामान्य पैटर्न है। AI इंसान नहीं है, इसलिए उसकी सीमाएँ होना स्वाभाविक है
    AI coding assistants में भी ऐसा ही देखा है। लोग security समस्याओं का हवाला देकर उसे पूरी तरह नकार देते हैं, लेकिन “एक वाक्य में native Mac app बनाने” की संभावना को नज़रअंदाज़ कर देते हैं
    • “AI क्या कर सकता है” और “AI evangelists क्या दावा करते हैं” — ये दोनों बिल्कुल अलग हैं। वे सीमाओं पर सवाल होने पर “AI को और इस्तेमाल करो” या “5 साल बाद सब हल हो जाएगा” जैसा जवाब देते हैं। ऐसे बढ़ा-चढ़ाकर किए गए वादे भरोसा तोड़ते हैं
    • “एक वाक्य में app बना देना” वाला उदाहरण गुणवत्ता के probabilistic होने की वजह से व्यवहार में भरोसेमंद नहीं है
    • वास्तव में “Hello World” स्तर से आगे, एक वाक्य में पूरा app बनाना असंभव है। editing और refinement ज़रूरी हैं
    • Spotify product की आलोचना को नज़रअंदाज़ करके “Mac app एक वाक्य में” वाली बात पर चले जाना अजीब तर्क-विकास है
    • लेखक के AI संबंधी सामान्यीकरण से सहमत नहीं हूँ, लेकिन Spotify DJ सच में बेहद खराब product है। इसकी तुलना Claude Code से नहीं की जा सकती
  • AI DJ कुछ वैसा ही लगता है जैसे AI से restaurant reviews लिखवाना। यह संभव तो है, लेकिन लोग मशीन की राय से ज़्यादा विशेषज्ञ इंसान की पसंद चाहते हैं
    Hör Berlin जैसे YouTube DJ mix की खासियत DJ का चयन, उसकी व्याख्या, और उसकी सांस्कृतिक पृष्ठभूमि है। AI अगर सिर्फ optimized list निकालता है, तो वह इस मूल सार को खो देता है
    • भविष्य curation के युग का होगा। गहरी जानकारी और संवेदनशीलता रखने वाले human curators का मूल्य शायद और बढ़ेगा
    • Spotify के mix में 10 साल से कोई बड़ा बदलाव नहीं है। DJ बस कोई mix चुनता है और LLM उस पर commentary जोड़ देता है। आखिरकार यह सिर्फ ML recommendation system ही है
    • मुझे SoundCloud की auto-generated lists से नया संगीत ढूँढना पसंद है। यह perfect नहीं है, लेकिन इसमें intentional exploration का मज़ा है
    • असली venue में दर्शकों की प्रतिक्रिया पढ़ने वाला human DJ और Spotify DJ पूरी तरह अलग चीज़ें हैं। बाद वाला बस साधारण shuffle पर LLM की बातें चिपकाने जैसा है
    • हाँ, कुछ लोग कला को सिर्फ रचना के रूप में consume भी करते हैं। वहाँ human curator का होना अनिवार्य नहीं है
  • समस्या का मूल music licensing structure है। Radio-type license में उपयोगकर्ता ट्रैक सीधे चुन नहीं सकता, और पूरे album playback पर भी रोक होती है
    Spotify लागत घटाने के लिए radio-type और interactive-type licenses को मिलाकर इस्तेमाल करता है। AI द्वारा बनाई गई playlist उपयोगकर्ता की सीधी पसंद नहीं मानी जाती, इसलिए संभव है उसे radio-type के रूप में treat किया जाए
  • अगर फोकस classical music पर है, तो Apple Music Classical पर जाना कहीं बेहतर है। PDF booklet, कलाकारों के बीच तुलना, खोज सुविधा — हर तरह से बेहतर है
    • मुझे लगता है Apple Music Classical या Idagio कहीं बेहतर हैं। Spotify classical market को छोटा मानता है, इसलिए उस पर ध्यान नहीं देता
  • Spotify जैसी recommendation-driven services नीरस हैं। इंसानी DJ की song selection कहीं अधिक दिलचस्प होती है
    मैं dublab, NTS1, NTS2 जैसे broadcasts सुनना पसंद करता हूँ, क्योंकि वहाँ अप्रत्याशित संगीत सुनने को मिलता है
    • AI curation की सबसे बड़ी समस्या input data की गुणवत्ता है। Similarity-based, randomness, और pattern-based सभी approaches की सीमाएँ हैं। आखिरकार वे इंसानी पसंद की विविधता को पकड़ नहीं पाते
      अरबों डॉलर खर्च करने पर भी perfect recommendation संभव नहीं हुई, और यह human DJ के social proof की जगह नहीं ले सकी
    • recommendation systems के शोध में इसे serendipity समस्या कहा जाता है। Relevance और surprise दोनों को साथ बढ़ाना बहुत कठिन काम है
    • मैं खुद mixtape बनाना या CD से निकाले गए MP3 मिलाकर सुनना पसंद करता हूँ। विदेशी भाषा बनाए रखने के लिए European radio भी सुनता हूँ, और YouTube, KEXP, Tiny Desk जैसे channels भी पसंद हैं
    • NTS सचमुच शानदार है। ज़्यादातर streaming algorithms ऐसे लगते हैं जैसे उन्हें सिर्फ background noise के लिए बनाया गया हो
    • सिफारिश के लिए धन्यवाद। मैंने NTS चलाया और सुनता ही रह गया। दूसरी recommendations भी स्वागतयोग्य हैं
  • लेख की शुरुआत से ही classical composers की लंबी सूची इतनी दिखावटी लगी कि मेरी रुचि खत्म हो गई। “DJ” शब्द खुद आधुनिक electronic music के साथ ज़्यादा मेल खाता है
    • “that moste illustriouse of musical traditionnes” जैसे वाक्यांश में हद से ज़्यादा दिखावा महसूस हुआ
    • DJ से आम तौर पर वही व्यक्ति समझ आता है जो शादी या club में pop या dance tracks चलाता है, Bach या Vivaldi को mix नहीं करता
    • ऐसा लगा जैसे AI ने composers की सूची अपने-आप generate कर दी हो
    • मुझे भी ऐसा ही लगा। ऊपर से “मुझे पता है लोग इन्हें नहीं जानते होंगे” जैसा जोड़ देना और भी हास्यास्पद लगा
    • पहले लगा कि यह मज़ाक है, लेकिन अंत तक पूरी गंभीरता देखकर अजीब लगा। मैंने Windows programming, Petzold की किताबों से सीखी थी, इसलिए Transformer model के बुनियादी सिद्धांत तक न समझने जैसा कथन देखकर हैरानी हुई
      यह भी खटका कि जैसे संगीत में सिर्फ pop और Western classical ही सब कुछ हों
  • “पश्चिमी सभ्यता के स्तंभ” जैसी बात वाले वाक्य से ही पढ़ना मुश्किल हो गया। आखिर निष्कर्ष वही साधारण है — Spotify classical के लिए उपयुक्त नहीं है, कोई दूसरी service इस्तेमाल कर लो
  • लेख का मुख्य सवाल था: “जब AI मूर्खतापूर्ण व्यवहार करता है तो उसकी ज़िम्मेदारी किसकी है?”
    मैं इसे prompt design की विफलता मानता हूँ। वही अनुरोध ChatGPT उदाहरण में जाँचें, तो AI सही प्रतिक्रिया देता है
    यानी या तो Spotify का model कमजोर है, या internal prompt गलत दिशा में ले जा रहा था
    “AI संगीत compose नहीं कर सकता” वाला दावा भी गलत तुलना है। AI पहले ही music theory की समझ और composition की संभावना दिखा चुका है। अंततः बात quality और taste की है
    • अगर prompt कुछ ऐसा हो कि “इसे मिलते-जुलते कलाकारों के गानों से आगे बढ़ाओ”, तो यह कम royalty वाले ट्रैक्स की ओर मोड़ने वाली business logic भी हो सकती है
    • उपयोगकर्ता पर ज़िम्मेदारी डालना खटकता है। Prompt स्पष्ट था। इस तरह AI industry का विस्तार दुनिया को और ज़्यादा मूर्ख और एकरस बना रहा है
  • यह लेख linguistic relativity का अच्छा उदाहरण है कि भाषा सोच को कैसे आकार देती है
    लोग हर बार LLM को “AI” कहते हैं, तो धारणा विकृत होती है।
    यह marketing industry की सबसे बड़ी सफलताओं में से एक है, और दुनिया को पहुँचाए गए सबसे बड़े नुकसानों में भी एक है