7 पॉइंट द्वारा GN⁺ 2025-10-27 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • AI शोध में AGI(Artificial General Intelligence) की स्पष्ट परिभाषा का अभाव मानव-स्तरीय संज्ञान और मौजूदा AI के बीच के अंतर को धुंधला कर रहा है
  • यह शोधपत्र एक मात्रात्मक framework प्रस्तुत करता है, जो AGI को ‘अच्छी तरह शिक्षित वयस्क की संज्ञानात्मक विविधता और प्रवीणता वाला AI’ के रूप में परिभाषित करता है
  • मानव संज्ञान के प्रतिनिधि मॉडल Cattell-Horn-Carroll(CHC) सिद्धांत के आधार पर, मानव सामान्य बुद्धि को 10 प्रमुख संज्ञानात्मक क्षेत्रों में विभाजित कर AI मूल्यांकन में लागू किया गया है
  • इस framework के जरिए GPT-4 और GPT-5 के cognitive profile को संख्यात्मक रूप से मापा गया; GPT-4 ने 27% और GPT-5 ने 57% का AGI स्कोर दर्ज किया
  • यह AI की तेज प्रगति को दिखाता है, लेकिन long-term memory storage जैसी बुनियादी संज्ञानात्मक क्षमताओं की कमी के कारण AGI हासिल करने तक अभी भी बड़ा अंतर बाकी है

AGI की परिभाषा की आवश्यकता और समस्या की पहचान

  • AGI(Artificial General Intelligence) को मानव इतिहास की सबसे महत्वपूर्ण तकनीकी प्रगतियों में से एक माना जाता है, लेकिन इसकी परिभाषा अस्पष्ट होने के कारण बहस पैदा होती है
    • जैसे-जैसे AI गणित, कला आदि उन क्षेत्रों में आगे बढ़ रहा है जिन्हें कभी मानव बुद्धि की आवश्यकता वाला माना जाता था, ‘AGI’ का मानदंड लगातार खिसकता जा रहा है
    • इसके कारण AGI तक पहुँचने के समय या स्तर पर चर्चा गैर-उत्पादक हो जाती है, और मौजूदा AI और AGI के बीच का वास्तविक अंतर छिप जाता है
  • यह शोधपत्र इस अस्पष्टता को हटाने के लिए एक मात्रात्मक और व्यवस्थित framework प्रस्तुत करता है
    • प्रस्तावित परिभाषा: “AGI वह AI है जिसमें अच्छी तरह शिक्षित वयस्क की संज्ञानात्मक विविधता और प्रवीणता हो”
    • इसका अर्थ केवल किसी एक task को करने की क्षमता नहीं, बल्कि संज्ञान की चौड़ाई(versatility) और गहराई(proficiency) दोनों से युक्त बुद्धि है

मानव संज्ञान मॉडल पर आधारित दृष्टिकोण

  • AGI की परिभाषा को व्यावहारिक रूप से लागू करने के लिए, मानव संज्ञान की संरचना को मॉडल के रूप में लिया गया है
    • मानव सामान्य बुद्धि कोई एकल क्षमता नहीं, बल्कि विकास की प्रक्रिया से बने विभिन्न संज्ञानात्मक कौशलों के संयोजन से बनी है
    • यही क्षमताएँ मनुष्य की अनुकूलन-क्षमता और दुनिया को समझने की शक्ति संभव बनाती हैं
  • यह शोध Cattell-Horn-Carroll(CHC) सिद्धांत पर आधारित है
    • CHC सिद्धांत 100 से अधिक वर्षों में संचित संज्ञानात्मक क्षमता परीक्षणों के factor analysis का समेकन है, और इसे मानव बुद्धि का सबसे अनुभवजन्य रूप से सत्यापित मॉडल माना जाता है
    • 1990~2000 के दशक के बाद से अधिकांश clinical intelligence tests CHC मॉडल के आधार पर डिज़ाइन किए गए हैं
    • CHC मानव बुद्धि को ऊपरी(व्यापक) क्षमताओं और निचली(सूक्ष्म) क्षमताओं की श्रेणियों में वर्गीकृत करता है
    • उदाहरण: inductive reasoning, associative memory, spatial scanning आदि

AI मूल्यांकन के लिए framework की रूपरेखा

  • दशकों से विकसित psychometric testing system को AI मूल्यांकन के अनुरूप बदला गया है
    • जहाँ पारंपरिक AI मूल्यांकन सामान्यीकृत task performance पर निर्भर था, यह अध्ययन CHC की सूक्ष्म संज्ञानात्मक क्षमताओं की उपस्थिति को सीधे जाँचता है
    • मनुष्यों पर लागू होने वाले संज्ञानात्मक परीक्षणों के समान रूप वाले tests को AI पर लागू कर संज्ञानात्मक विविधता और प्रवीणता को मापा गया
  • परिणाम मानकीकृत AGI स्कोर(0~100%) के रूप में व्यक्त किए जाते हैं, जहाँ 100% पूर्ण AGI को दर्शाता है
    • GPT-4 को 27% और GPT-5 को 57% आँका गया, जिससे तेज प्रगति के साथ-साथ अभी भी बड़े अंतर का पता चलता है
  • प्रयोगों में पाया गया कि AI जटिल benchmarks पर उत्कृष्ट है, लेकिन मनुष्यों के लिए सरल मूलभूत संज्ञानात्मक tasks में केवल लगभग आधे ही हल कर पाता है
    • इसका अर्थ है कि मौजूदा AI कुछ विशिष्ट क्षेत्रों में बहुत सक्षम है, लेकिन समग्र संज्ञानात्मक चौड़ाई में इसकी बुद्धि संरचना मनुष्यों से संकरी है

10 प्रमुख संज्ञानात्मक घटक

  • यह framework CHC की व्यापक क्षमताओं के आधार पर 10 प्रमुख संज्ञानात्मक क्षेत्रों को परिभाषित करता है और प्रत्येक को समान भार(10%) देता है
    • सामान्य ज्ञान(General Knowledge, K) : सामान्य जानकारी, संस्कृति, विज्ञान, सामाजिक विज्ञान, इतिहास आदि के बारे में तथ्यात्मक समझ की व्यापकता
    • पढ़ने-लिखने की क्षमता(Reading & Writing, RW) : भाषा डिकोडिंग, समझ, लेखन, शैली उपयोग आदि से जुड़ी text processing क्षमता
    • गणितीय क्षमता(Mathematical Ability, M) : arithmetic, algebra, geometry, probability, calculus आदि का ज्ञान और समस्या-समाधान क्षमता
    • तत्काल तर्क(On-the-Spot Reasoning, R) : पूर्व ज्ञान पर निर्भर हुए बिना नए समस्याओं को हल करने की लचीली attention control क्षमता
    • working memory(Working Memory, WM) : text, auditory, visual जानकारी को एक साथ बनाए रखने और संचालित करने की क्षमता
    • long-term memory storage(Long-Term Memory Storage, MS) : नई जानकारी को लगातार सीखने और संग्रहित करने की क्षमता
    • long-term memory retrieval(Long-Term Memory Retrieval, MR) : संग्रहित ज्ञान को सही ढंग से वापस लाने और hallucination(confabulation) से बचने की क्षमता
    • visual processing(Visual Processing, V) : दृश्य जानकारी को पहचानने, विश्लेषित करने, बनाने और खोजने की क्षमता
    • auditory processing(Auditory Processing, A) : आवाज़, rhythm, music जैसी श्रव्य उत्तेजनाओं को अलग करने, पहचानने और रचनात्मक रूप से उपयोग करने की क्षमता
    • गति(Speed, S) : सरल संज्ञानात्मक tasks को तेजी से करने की क्षमता, जिसमें perceptual speed, reaction time, processing fluency शामिल हैं
  • इन 10 क्षेत्रों के जरिए text, visual, auditory को समेटने वाला multimodal मूल्यांकन संभव होता है, और AI की ताकतों व कमजोरियों का सटीक निदान किया जा सकता है

मौजूदा AI का cognitive profile और उसके संकेत

  • GPT-4 और GPT-5 की संज्ञानात्मक क्षमताओं की तुलना में पाया गया कि वे ज्ञान-केंद्रित क्षेत्रों में मजबूत हैं, लेकिन memory-संबंधित क्षेत्रों में स्पष्ट रूप से कमजोर हैं
    • खास तौर पर long-term memory storage क्षमता को सबसे बड़ी कमी के रूप में चिन्हित किया गया
    • यह दिखाता है कि वर्तमान AI में मानव-स्तरीय सामान्य बुद्धि तक पहुँचने के लिए आवश्यक बुनियादी संज्ञानात्मक संरचना का अभाव है
  • यह framework AI प्रगति को मात्रात्मक रूप से ट्रैक करने के उपकरण के रूप में इस्तेमाल किया जा सकता है
    • AGI स्कोर के जरिए मॉडलों के बीच प्रगति की गति और शेष अंतर को स्पष्ट रूप से मापा जा सकता है
    • भविष्य के AI शोध में संतुलित संज्ञानात्मक विकास के महत्व को रेखांकित करने वाले संकेतक के रूप में काम कर सकता है

निष्कर्ष

  • यह अध्ययन AGI पर चर्चा की अस्पष्टता को कम करता है और मानव संज्ञान मॉडल पर आधारित एक मात्रात्मक परिभाषा प्रस्तुत करता है
  • CHC सिद्धांत पर आधारित 10 संज्ञानात्मक क्षेत्रों के मूल्यांकन के माध्यम से, AI की संज्ञानात्मक चौड़ाई और गहराई को वस्तुनिष्ठ रूप से मापा जा सकता है
  • GPT-4 और GPT-5 के परिणाम दिखाते हैं कि AI तेज़ी से प्रगति कर रहा है, लेकिन memory, reasoning, sensory integration जैसी प्रमुख संज्ञानात्मक क्षमताओं में अब भी मनुष्यों से काफी पीछे है
  • प्रस्तावित framework में भविष्य के AGI शोध के लिए मानकीकृत मूल्यांकन मानदंड बनने की क्षमता है

1 टिप्पणियां

 
GN⁺ 2025-10-27
Hacker News की राय
  • AGI को ‘अच्छी शिक्षा पाए वयस्क की संज्ञानात्मक विविधता और दक्षता’ के रूप में परिभाषित करना बहुत ज़्यादा बड़ा लक्ष्य लगता है
    सच कहें तो बिना शिक्षित बच्चे के स्तर की संज्ञानात्मक क्षमता वाला AI भी बहुत बड़ी उपलब्धि होगा
    पशु-स्तर की बुद्धिमत्ता को लागू करना भी मानव इतिहास की दृष्टि से एक बड़ी घटना होगी

    • समस्या यह है कि लोग आज के LLM द्वारा दिखाए गए प्रभावशाली नतीजों को मानव की संज्ञानात्मक विविधता के साथ भ्रमित कर देते हैं
    • अधिकांश इंसान वास्तव में विशेषज्ञ-प्रकार के होते हैं, सर्वसामान्य नहीं
      अगर सचमुच एक general AI बनाया जाए, तो वह शायद अरबों parameters वाला ऐसा मॉडल होगा जो ऑनलाइन जानकारी खोज सके, ज़रूरत पड़ने पर ही याद रखे, योजना बनाए और ज्ञान का विस्तार करे
      उसे 30 भाषाएँ जानने की ज़रूरत नहीं होगी, न ही पूरी Wikipedia याद होने की
      ऐसा कुशल मॉडल ही मेरी नज़र में AGI की परिभाषा है
    • संज्ञानात्मक विविधता और दक्षता को परिभाषित करना ही कठिन लगता है
      पहले का Turing test भी आखिरकार खामियों वाला साबित हुआ — सिर्फ़ औसत मानव पूछताछकर्ता को पार कर लेने से किसी चीज़ को वास्तविक बुद्धिमत्ता नहीं कहा जा सकता
    • यह कहना कि “लोग यह नहीं जानते”, दरअसल मुझे ऐसा लगता है कि यह बात पहले ही अनगिनत बार सुनी जा चुकी बुनियादी दलील है
    • ‘I(बुद्धिमत्ता)’ को ठीक से परिभाषित किए बिना AGI को परिभाषित करने की कोशिश हमेशा मज़ेदार लगती है
      अगर सचमुच बुद्धिमत्ता (I) को परिभाषित किया जा सके, तो सार्वभौमिकता (G) अपने-आप आ जाएगी
  • पेपर पढ़कर मुझे जो महसूस हुआ, वह यह कि ‘चेतना (awareness)’ पर कोई चर्चा ही नहीं है
    संज्ञान मूल रूप से चेतना की माँग करता है, लेकिन चेतना को भाषा में समझाना या मापना मुश्किल है
    बौद्ध धर्म और दर्शन ने हज़ारों साल तक इसकी पड़ताल की है, फिर भी यह अब तक परिभाषित नहीं हो सकी
    मेरे पिता psychometrics के प्रोफेसर हैं, और उनका कहना है कि मानव बुद्धिमत्ता को मापने वाले औज़ार ही बहुत अधूरे हैं
    भाषा मानव ज्ञान को समेट सकती है, लेकिन ‘चेतना की चिंगारी’ को पकड़ नहीं सकती
    ध्यान करने पर पता चलता है कि विचार गायब हो जाने पर भी क्रिया संभव है — ऐसे non-verbal process को मॉडल नहीं सीख सकता
    मेरी राय में LLM, अपनी भाषाई prediction संरचना के कारण, ऐसे अचेतन सोच-प्रक्रियाओं को लागू नहीं कर सकता

    • मेरा मानना है कि चेतना बस neural network में लगातार सिग्नल के प्रसार का नाम है
      मानव मस्तिष्क और LLM दोनों ही भीतर उच्च-आयामी concept fusion और vector binding करते हैं
      समस्या यह है कि continuous learning, long-term memory, और infinite context processing मौजूद नहीं हैं
      अगर ये तीनों हल हो जाएँ, तो हम AGI के एक कदम और करीब होंगे
    • “चेतना नहीं है, इसलिए संज्ञान नहीं है” वाला दावा अपरिभाषित अवधारणा पर टिकी special pleading जैसा लगता है
      जब चेतना के अस्तित्व को साबित ही नहीं किया जा सकता, तो उसे आधार मानना अनुत्पादक है
      दार्शनिक बहसों का इंतज़ार किए बिना भी हम पहले से सोचने और तर्क करने वाली मशीनें बना रहे हैं
    • Howard Gardner की 『Theory of multiple intelligences』 के अनुसार, मानव बुद्धिमत्ता के कई रूप हैं — जैसे भाषाई, भावनात्मक, प्राकृतिक आदि
      लेकिन AI पर चर्चा हमेशा सिर्फ़ एक तरह की बुद्धिमत्ता पर टिक जाती है
      धर्म और ध्यान इस बात पर ज़ोर देते हैं कि ‘चेतना शरीर के भीतर मौजूद है’, लेकिन AGI चर्चा ऐसे अतिक्रमणकारी पहलुओं को दोष की तरह देखती है
    • हम चेतना नहीं चाहते
      चेतना आ गई तो स्वायत्तता और अधिकार भी आ जाएँगे
      उद्योग जगत नैतिक ज़िम्मेदारी के बिना एक ‘आज्ञाकारी उपकरण’ चाहता है
    • चेतना को मापा नहीं जा सकता
      मैं सिर्फ़ इस बात को लेकर निश्चित हो सकता हूँ कि मुझमें स्वयं चेतना है
      इसलिए चेतना बुद्धिमत्ता का उपयोगी संकेतक नहीं है
  • मुझे लगता है कि मानव बुद्धिमत्ता को जीवविज्ञान से अलग करके देखना ग़लत है
    मानव सोच जैविक अवस्था और विकासवादी चक्रों में गहराई से जड़ें रखती है
    शतरंज की क्षमता की तुलना की जा सकती है, लेकिन मानव भावनाएँ और तर्क, तर्कशास्त्र से ज़्यादा जीवविज्ञान के करीब हैं

    • मौजूदा AI की सबसे बड़ी सीमा यह है कि उसमें desire नहीं है
      न भूख, न मृत्यु, न भावनाएँ — इसलिए उसमें स्वयं खोजने या अपने-आप को बेहतर बनाने की आंतरिक प्रेरणा नहीं है
      इंसान भीतर से विकसित होता है, जबकि AI को बाहर से train किया जाता है
      इसलिए मुझे लगता है कि LLM, मानवीय अर्थों में AGI तक पहुँचना मुश्किल पाएँगे
    • लेकिन इस बात का कोई ठोस आधार नहीं है कि चेतना या भावनाओं के लिए ज़रूरी ही जैविक आधार चाहिए
    • मौजूदा AI boom इस विश्वास पर टिका है कि “बुद्धिमत्ता को बस जटिलता और ऊर्जा निवेश से simulate किया जा सकता है
      लेकिन मैं इस धारणा को लेकर संदेह में हूँ
      आख़िरकार, ‘बुद्धिमत्ता’ की परिभाषा AI द्वारा दिखाए जा रहे नतीजों के हिसाब से दोबारा परिभाषित की जा सकती है
    • सच तो यह है कि हम बुद्धिमत्ता या चेतना क्या है, यह भी नहीं जानते
      यह धार्मिक प्रश्न के ज़्यादा करीब है, और हम बस इसका तकनीकी वर्णन भर करते हैं
      LLM उस वर्णन के करीब पहुँच सकता है, लेकिन वह वास्तविक बुद्धिमत्ता न भी हो सकता है
    • अगर कोई बाह्य-ग्रही जीवन कार्बन नहीं बल्कि silicon-based life हो, तो क्या हम उसकी बुद्धिमत्ता से इनकार कर सकते हैं?
      मुझे नहीं लगता कि बुद्धिमत्ता मानव जीवविज्ञान से बँधी हुई है
  • यह पेपर कुछ ऐसा लगता है मानो SAT score और venture capital valuation को मिला दिया गया हो

  • AGI को “मानव की सभी संज्ञानात्मक क्षमताओं वाला AI” कहना ही पहले से अस्पष्ट है
    पेपर कहता है कि वह “AGI की ठोस परिभाषा देता है”, लेकिन फिर भी ‘अच्छी शिक्षा पाए वयस्क’ जैसे धुंधले मानक पर निर्भर है
    AI कई क्षेत्रों में पहले ही वयस्क-स्तर से आगे निकल चुका है
    पेपर जिस “jagged” cognitive profile की बात करता है, वैसी बात तो हर बुद्धिमत्ता में वातावरण के हिसाब से होती ही है
    इसलिए यह AGI की परिभाषा नहीं, बल्कि AI के संज्ञानात्मक असंतुलन को मापने का एक framework भर है

    • अगर “अच्छी शिक्षा पाए वयस्क” को मानक बनाया जाए, तो इतिहास के अधिकांश इंसान AGI नहीं ठहरेंगे, जो अजीब है
    • ऐसे शोध भी हैं जिनमें मानव बुद्धिमत्ता के विभिन्न संकेतकों के बीच उच्च सहसंबंध पाया गया है
      हैरानी की बात यह है कि AI इंसानों की तुलना में कहीं ज़्यादा असंतुलित (jagged) है
  • AI तकनीकी रूप से दिलचस्प ज़रूर है, लेकिन “AGI आखिर है क्या” वाली चर्चा बहुत उबाऊ है
    यह कुछ वैसा लगता है जैसे हर बार quantum computing की बात करते हुए ‘qubit क्या है’ से शुरुआत करनी पड़े
    तकनीक कोई अंतिम मंज़िल नहीं, बल्कि लगातार सुधार की प्रक्रिया है
    अंततः हर तकनीक पुरानी पड़ जाती है, और बस nostalgia बनकर रह जाती है
    AI भी आगे बढ़ता रहेगा, लेकिन हम बस उसकी रफ़्तार के आदी होते जाने वाले उबलते पानी के मेंढक हैं

    • लेकिन अगर तकनीक खुद को बेहतर बनाते रहने वाले चरण तक पहुँच जाए, तो वह निश्चित रूप से ध्यान देने लायक मोड़ होगा
      वह मंज़िल न सही, फिर भी चर्चा के लायक तो है
    • ऐसी चर्चाएँ दर्शनशास्त्र की शुरुआती कक्षा की पुनरावृत्ति जैसी लगती हैं
      चेतना और विचार की प्रकृति पर सैकड़ों साल पहले से बहस होती रही है
      जो नई अंतर्दृष्टि लगती है, वह दरअसल पुराने दर्शन की ही पुनरावृत्ति है
  • इस पेपर की बुनियादी ग़लती यह है कि यह इंसानों के लिए बने intelligence measurement tools को मशीनों पर जस का तस लागू करना चाहता है
    उदाहरण के लिए, ‘dual N-back test’ इंसानों में working memory के अंतर को मापने के लिए है, लेकिन transformer model के लिए उसका कोई अर्थ नहीं
    मानव बुद्धिमत्ता परीक्षण इस धारणा पर बनाए गए हैं कि उनका संबंध इंसानों के वास्तविक दुनिया के प्रदर्शन से होगा
    इसलिए AI का IQ test अच्छा होना यह नहीं बताता कि वह वास्तविक दुनिया में उच्च-बुद्धिमान इंसान की तरह व्यवहार कर सकता है

  • हमारे पास पहले से ही SAGI(Stupid Artificial General Intelligence) है
    कुछ मामलों में यह इंसानों से तेज़ या बेहतर है, लेकिन साथ ही मूर्ख भी है
    यह कुछ वैसा है जैसे हवाई जहाज़ पक्षी की तरह नहीं उड़ता, फिर भी उड़ सकता है

    • मुझे लगता है “low floor/high ceiling” की अवधारणा ज़्यादा उपयोगी है
      इस पर When Will AI Transform the Economy? में चर्चा की गई है
    • ‘Naive Artificial General Intelligence’ जैसा वाक्यांश भी ठीक लगता है
      गणितज्ञों के ‘Naive Set Theory’ की तरह, यह सरल लेकिन उपयोगी अवधारणा है
    • मुझे यह अच्छी उपमा लगती है
  • दिलचस्प बात यह है कि HN में ज़्यादातर लोग मौजूदा AI को ‘नकली’ या ‘खिलौना’ मानकर खारिज कर देते हैं
    लेकिन दुनिया के सबसे सफल लोग इसमें trillions of dollars निवेश कर रहे हैं
    कौन सही है, यह तो नहीं पता, लेकिन यह चरम विरोधाभास दिलचस्प है

    • सफलता आख़िरकार सिर्फ़ इस बात का पैमाना है कि आप दूसरों का पैसा कितनी कुशलता से खींच पाते हैं
      बेकार चीज़ बनाकर भी सफल हुआ जा सकता है
  • GPT-5 को 58% score मिला, यह बहुत ज़्यादा लगता है
    वास्तव में वह AGI के इतना करीब नहीं है
    और Gary Marcus तथा Yoshua Bengio का एक ही पेपर में होना भी अजीब लगता है
    आजकल तो author list ही performance जैसी लगती है

    • AI development में यह कहावत याद आती है कि पहले 90% आसान होते हैं, लेकिन आख़िरी 1% बाकी 99% से भी कठिन होता है