मेरा मानना है कि Yann LeCun LLMs के बारे में सही थे (हालांकि यह संयोग भी हो सकता है)

(substack.com)

21 पॉइंट द्वारा GN⁺ 2025-02-24 | 2 टिप्पणियां | WhatsApp पर शेयर करें

पिछले कुछ वर्षों में AGI(Artificial General Intelligence, सामान्य कृत्रिम बुद्धिमत्ता) पर चर्चा तेज़ी से बढ़ी है
AGI की सटीक परिभाषा अस्पष्ट है और इस पर काफी विवाद है, इसलिए AGI timeline तय करना चर्चा का एक आम तरीका बन गया है
- "लंबी timeline": यह दृष्टिकोण कि AGI 10–20 साल बाद आएगा
- "छोटी timeline": यह दावा कि AGI बहुत जल्द आ जाएगा
लेकिन AI की प्रगति पर इस तरह चर्चा करना अप्रभावी है
- इसे AGI नाम की किसी मंज़िल की ओर बढ़ना नहीं, बल्कि AI की productivity बढ़ने की प्रक्रिया के रूप में देखना अधिक उचित है
- AI इस दिशा में विकसित हो रहा है कि वह कम मानव हस्तक्षेप के साथ अधिक काम कर सके
  - उदाहरण: data labeling, code लिखना, गणित के सवाल हल करना, autonomous driving, automatic flight आदि
- लेकिन क्या AI कभी ऐसे बिंदु तक पहुंचेगा जहां वह हमेशा के लिए मानव हस्तक्षेप के बिना काम कर सके, यह अनिश्चित है
- हमें यह मापना चाहिए कि दिए गए input के मुकाबले AI कितनी value उत्पन्न कर सकता है
AI की प्रगति को मानव द्वारा लगाए गए प्रयास की तुलना में AI द्वारा उत्पन्न आर्थिक value में वृद्धि के रूप में देखा जा सकता है
अहम सवाल:
- क्या AI अनंत रूप से बेहतर होकर मानव हस्तक्षेप के बिना आर्थिक value बना सकता है?
- या फिर क्या वह किसी स्तर पर तकनीकी सीमा तक पहुंच जाएगा?
अगर AI पूरी तरह मानव हस्तक्षेप के बिना आर्थिक value पैदा कर सकता है, तो यह काफी जोखिमपूर्ण परिणाम भी हो सकता है

हमने यह घटना पहले भी देखी है (autonomous cars)

AI उद्योग में language model boom से पहले, करीब 2017 में autonomous car boom आया था
- उस समय कई कंपनियों ने कहा था कि वे 1 साल के भीतर Full Self-Driving, FSD कारें लॉन्च करेंगी और उन्होंने अरबों डॉलर का investment जुटाया
- लाखों मील ड्राइविंग हुईं, कई कंपनियां बनीं, लेकिन कुछ अंततः दिवालिया हो गईं
अब भी पूरी FSD हासिल नहीं हुई है
- Tesla अब भी पूरी तरह self-driving हासिल नहीं कर पाई है, और Waymo केवल खास पहले से mapped क्षेत्रों में आंशिक रूप से काम कर पाता है
- अब भी बीच-बीच में मानव हस्तक्षेप की ज़रूरत पड़ती है

2016 में Tesla CEO Elon Musk की भविष्यवाणी:
"इस साल के भीतर Tesla लॉस एंजेलिस से न्यूयॉर्क तक पूरी तरह autonomous drive करेगी।"
→ लेकिन 2024 तक भी यह सच नहीं हुआ (Tesla अब भी "Full Self-Driving" subscription option बेच रही है)

अब यह बहस करने के बजाय कि autonomous driving पूरी तरह संभव होगी या नहीं, "miles-per-intervention" को मापना ज़्यादा व्यावहारिक तरीका बन गया है
- यानी, एक बार मानव हस्तक्षेप के बिना कार कितनी दूर चल सकती है, इसे मापना
हालिया रिपोर्ट के अनुसार, Tesla को औसतन हर 13 मील पर एक बार मानव हस्तक्षेप चाहिए
- बड़े AI models, तेज़ inference speed, ज़्यादा data, और बेहतर engineering आने पर यह संख्या बढ़ सकती है
- लेकिन क्या मौजूदा तकनीक के साथ यह संख्या अनंत तक बढ़ सकती है, यह अनिश्चित है
यानी, हम अब भी नहीं जानते कि autonomous driving models अनंत रूप से बेहतर होकर मानव हस्तक्षेप को पूरी तरह अनावश्यक बना देंगे, या किसी स्तर पर सीमा तक पहुंच जाएंगे

Yann LeCun क्यों गलत थे (आंशिक रूप से)

Meta के chief AI scientist Yann LeCun ने पहले यह तर्क दिया था कि language models मानव-स्तर की बुद्धिमत्ता तक नहीं पहुंच सकते
वजह: language models token unit में output बनाते हैं, हर token पर गलती होने की संभावना होती है, और ये गलतियां जमा होकर अंततः performance गिरा देंगी
उन्होंने इस error accumulation problem को language models की गंभीर सीमा माना और कहा कि इसे हल करने के लिए मौजूदा autoregressive तरीके को छोड़ना होगा
लेकिन वास्तविकता अलग निकली
- आधुनिक AI systems (OpenAI o1/o3, DeepSeek R1 आदि) इस परिकल्पना को सीधे चुनौती देते हैं
- ये अब भी autoregressive हैं, लेकिन उल्टा, जितना लंबा output बनाते हैं उतना performance बेहतर होता दिखता है
- DeepSeek R1 के शोध में यह पैटर्न दिखा कि मॉडल जितनी देर तक सोचता है, सही जवाब मिलने की संभावना उतनी बढ़ती है
  
  DeepSeek R1 report के graph में दिखता है कि मॉडल लंबे output के साथ बेहतर perform करता है → यह Yann LeCun की परिकल्पना से सीधा टकराता है
मॉडल अपनी गलतियां खुद कैसे सुधारता है
- पुराना तर्क इस मान्यता पर आधारित था कि गलतियां token दर token बस जमा होती जाएंगी
- लेकिन नई research में मॉडल के पास अपनी गलतियां खुद सुधारने के mechanism दिखाई देते हैं
- उदाहरण के लिए, जब कुछ खास token patterns बनते हैं, तो बीच में probabilistically बेहतर जवाब की ओर बढ़ने की प्रवृत्ति देखी गई है
  
  DeepSeek R1 का उदाहरण: मॉडल किसी खास बिंदु पर "बेहतर जवाब" खोजने की प्रक्रिया दिखाता है → वही चीज़ जिसे Yann LeCun ने असंभव कहा था
अभी कुछ शोधकर्ता इन self-correction mechanisms का विश्लेषण कर रहे हैं और यह समझने की कोशिश कर रहे हैं कि इन्हें और प्रभावी तरीके से कैसे प्रेरित किया जाए
हालांकि, यह अब भी स्पष्ट नहीं है कि क्या यह तरीका केवल coding, math problems जैसे खास प्रकार के सवालों पर ही लागू होता है

Yann LeCun क्यों सही थे (आंशिक रूप से)

Yann LeCun की परिकल्पना पूरी तरह गलत नहीं थी
भले ही नई research ने उनकी "error accumulation" परिकल्पना को चुनौती दी है, लेकिन यह बात अब भी सही है कि language models अनंत रूप से सटीक output नहीं बना सकते
यानी, AI हमेशा के लिए स्वतंत्र रूप से काम नहीं कर सकता
पूर्ण autonomous agents (FAA) की सीमाएं
- कई शोधकर्ता ऐसे AI agents बनाना चाहते हैं जो लंबी अवधि वाले tasks कर सकें
- लेकिन इसमें Full Self-Driving, FSD कार बनाने जैसी ही समस्या है
- यानी, मौजूदा technology stack के साथ पूरी तरह autonomous AI systems संभव न भी हों
मानव input का महत्व
- सबसे विश्वसनीय जानकारी वही होती है जो इंसान सीधे prompt में देता है
- कुछ tools (जैसे flight lookup, weather check आदि) के ज़रिए AI अतिरिक्त data पा सकता है, लेकिन सिर्फ बहुत लंबा output बनाने से सही जवाब की संभावना अनंत रूप से नहीं बढ़ती
- मानव हस्तक्षेप के बिना AI के अनंत रूप से उपयोगी output बनाने की संभावना कम है

AI research में AGI चर्चा से बचना क्यों चाहिए

language models की प्रगति को AGI timeline से मापना गलत तरीका है
बेहतर सवाल यह होना चाहिए: "AI मानव हस्तक्षेप के बिना कितनी देर तक प्रभावी ढंग से काम कर सकता है?"
autonomous driving के "miles-per-intervention" की तरह, language models के लिए भी यह मापना ज़्यादा व्यावहारिक है कि वे मानव हस्तक्षेप के बिना कितनी देर तक सटीक output बना सकते हैं
पूरी तरह मानव हस्तक्षेप के बिना काम करने वाले AI (FAA, Fully Autonomous Agent) का इंतज़ार करने के बजाय, मौजूदा "उपयोगी AI workload में बढ़ोतरी" जैसी सतत प्रगति की प्रक्रिया को पहचानना ज़रूरी है
भले ही पूर्ण AGI न हो, मौजूदा तकनीक जो आर्थिक value दे रही है, वह भी पर्याप्त रूप से महत्वपूर्ण है
इसलिए, AGI कब आएगा इस पर बहस करने से बेहतर दिशा AI की वास्तविक productivity को सुधारना है

2 टिप्पणियां

princox 2025-02-27

"AI हमेशा के लिए स्वतंत्र रूप से काम नहीं कर सकता"

यह हिस्सा प्रभावशाली लगा।

GN⁺ 2025-02-24

Hacker News राय

Satya Nadella ने AGI के बारे में बात की
- Microsoft के revenue से भी ज़्यादा महत्वपूर्ण AGI को लेकर बनी अत्यधिक अपेक्षाओं को नियंत्रित करना है
- विकसित देशों की economic growth rate केवल 2% है, और inflation को ध्यान में रखें तो यह लगभग 0% है
- 2025 में economic growth को लेकर चुनौतियाँ होंगी
- Industrial Revolution जैसी growth हासिल करनी होगी
- जीत उन industries की होगी जो AGI का उपयोग करेंगी, न कि केवल tech companies की
- जब productivity बढ़ेगी और economy तेज़ी से grow करेगी, तब industries भी आगे बढ़ेंगी
- AGI की उपलब्धियों की आत्म-प्रशंसा का कोई अर्थ नहीं; असली मानदंड यह है कि world economy 10% बढ़े
लोगों को काम देने के तरीक़े खोजना महत्वपूर्ण है
- AGI से ASI की ओर marketing shift एक जाल है
- "gig" economy की आलोचना के बावजूद, कई लोग Uber या DoorDash के माध्यम से बेहतर जीवन जी रहे हैं
- Uber और DoorDash रोज़मर्रा की ज़िंदगी में value देते हैं
- delivery workers को tip दी जाती है ताकि वे minimum wage से अधिक कमा सकें
- हर कोई self-learning के ज़रिए software engineer या entrepreneur नहीं बन सकता
- लोगों को काम उपलब्ध कराना महत्वपूर्ण है
LLM के "reasoning" को लेकर संदेह बढ़ रहा है
- DeepSeek और Grok के नतीजों से LLM की सीमाएँ देखी जा सकीं
- कुछ मामलों में model अक्षम या ग़लत रास्ते पर चला जाता है
- उदाहरण के लिए, Grok 3 ने किसी खास card name को बार-बार जाँचने में 10 मिनट बिता दिए
- कभी-कभी model self-reinforcing, non-productive behavior में फँस जाता है
self-driving cars पर चर्चा
- Tesla अभी भी पूरी तरह autonomous driving में सक्षम नहीं है, और Waymo केवल कुछ खास इलाकों में ही यह कर पाता है
- कुछ AI systems लंबे output बनाते हुए बेहतर प्रदर्शन करते हैं
- लेकिन लंबा output अपने-आप model को बेहतर नहीं बनाता
- LeCun का तर्क language models में error accumulation की समस्या की ओर इशारा करता है
AGI और humanoid robots को लेकर अत्यधिक उम्मीदें
- AGI से ज़्यादा economic benefit पर ध्यान देना चाहिए
- AGI का लक्ष्य मनुष्यों के 99.99% से आगे निकलना है
AGI को लेकर लोगों की अपेक्षाएँ
- लोग वास्तव में AGI नहीं, कुछ और चाहते हैं
- अगर AGI में autonomy आ गई, तो उसे नियंत्रित करना मुश्किल हो जाएगा
- लोग ऐसे experts चाहते हैं जो तकनीकी रूप से बेहद सक्षम हों लेकिन निर्देशों का पालन करें
language diffusion models की सफलता
- error accumulation की समस्या को हल करने के लिए remasking strategy का उपयोग किया जाता है
- एक साथ कई tokens predict करने में यह सफल रहा है
AI के economic value को लेकर सवाल
- जब AI इंसानी productivity बढ़ाएगा, तो उसका economic value आखिर किस तक पहुँचेगा
- अगर human employment घटता है, तो economic value distribution के लिए योजना की ज़रूरत होगी
AI और इंसानी सपनों की तुलना
- AI जिस तरह reality model के आधार पर scenarios बनाता और विस्तार देता है, वह सपनों जैसा हो सकता है
- यह सवाल उठता है कि क्या LLM में real-time input जोड़कर उसे "जगा" पाना संभव होगा

मेरा मानना है कि Yann LeCun LLMs के बारे में सही थे (हालांकि यह संयोग भी हो सकता है)

हमने यह घटना पहले भी देखी है (autonomous cars)

Yann LeCun क्यों गलत थे (आंशिक रूप से)

Yann LeCun क्यों सही थे (आंशिक रूप से)

AI research में AGI चर्चा से बचना क्यों चाहिए

संबंधित पढ़ाई

2 टिप्पणियां

Hacker News राय