- AI शोध में AGI(Artificial General Intelligence) की स्पष्ट परिभाषा का अभाव मानव-स्तरीय संज्ञान और मौजूदा AI के बीच के अंतर को धुंधला कर रहा है
- यह शोधपत्र एक मात्रात्मक framework प्रस्तुत करता है, जो AGI को ‘अच्छी तरह शिक्षित वयस्क की संज्ञानात्मक विविधता और प्रवीणता वाला AI’ के रूप में परिभाषित करता है
- मानव संज्ञान के प्रतिनिधि मॉडल Cattell-Horn-Carroll(CHC) सिद्धांत के आधार पर, मानव सामान्य बुद्धि को 10 प्रमुख संज्ञानात्मक क्षेत्रों में विभाजित कर AI मूल्यांकन में लागू किया गया है
- इस framework के जरिए GPT-4 और GPT-5 के cognitive profile को संख्यात्मक रूप से मापा गया; GPT-4 ने 27% और GPT-5 ने 57% का AGI स्कोर दर्ज किया
- यह AI की तेज प्रगति को दिखाता है, लेकिन long-term memory storage जैसी बुनियादी संज्ञानात्मक क्षमताओं की कमी के कारण AGI हासिल करने तक अभी भी बड़ा अंतर बाकी है
AGI की परिभाषा की आवश्यकता और समस्या की पहचान
- AGI(Artificial General Intelligence) को मानव इतिहास की सबसे महत्वपूर्ण तकनीकी प्रगतियों में से एक माना जाता है, लेकिन इसकी परिभाषा अस्पष्ट होने के कारण बहस पैदा होती है
- जैसे-जैसे AI गणित, कला आदि उन क्षेत्रों में आगे बढ़ रहा है जिन्हें कभी मानव बुद्धि की आवश्यकता वाला माना जाता था, ‘AGI’ का मानदंड लगातार खिसकता जा रहा है
- इसके कारण AGI तक पहुँचने के समय या स्तर पर चर्चा गैर-उत्पादक हो जाती है, और मौजूदा AI और AGI के बीच का वास्तविक अंतर छिप जाता है
- यह शोधपत्र इस अस्पष्टता को हटाने के लिए एक मात्रात्मक और व्यवस्थित framework प्रस्तुत करता है
- प्रस्तावित परिभाषा: “AGI वह AI है जिसमें अच्छी तरह शिक्षित वयस्क की संज्ञानात्मक विविधता और प्रवीणता हो”
- इसका अर्थ केवल किसी एक task को करने की क्षमता नहीं, बल्कि संज्ञान की चौड़ाई(versatility) और गहराई(proficiency) दोनों से युक्त बुद्धि है
मानव संज्ञान मॉडल पर आधारित दृष्टिकोण
- AGI की परिभाषा को व्यावहारिक रूप से लागू करने के लिए, मानव संज्ञान की संरचना को मॉडल के रूप में लिया गया है
- मानव सामान्य बुद्धि कोई एकल क्षमता नहीं, बल्कि विकास की प्रक्रिया से बने विभिन्न संज्ञानात्मक कौशलों के संयोजन से बनी है
- यही क्षमताएँ मनुष्य की अनुकूलन-क्षमता और दुनिया को समझने की शक्ति संभव बनाती हैं
- यह शोध Cattell-Horn-Carroll(CHC) सिद्धांत पर आधारित है
- CHC सिद्धांत 100 से अधिक वर्षों में संचित संज्ञानात्मक क्षमता परीक्षणों के factor analysis का समेकन है, और इसे मानव बुद्धि का सबसे अनुभवजन्य रूप से सत्यापित मॉडल माना जाता है
- 1990~2000 के दशक के बाद से अधिकांश clinical intelligence tests CHC मॉडल के आधार पर डिज़ाइन किए गए हैं
- CHC मानव बुद्धि को ऊपरी(व्यापक) क्षमताओं और निचली(सूक्ष्म) क्षमताओं की श्रेणियों में वर्गीकृत करता है
- उदाहरण: inductive reasoning, associative memory, spatial scanning आदि
AI मूल्यांकन के लिए framework की रूपरेखा
- दशकों से विकसित psychometric testing system को AI मूल्यांकन के अनुरूप बदला गया है
- जहाँ पारंपरिक AI मूल्यांकन सामान्यीकृत task performance पर निर्भर था, यह अध्ययन CHC की सूक्ष्म संज्ञानात्मक क्षमताओं की उपस्थिति को सीधे जाँचता है
- मनुष्यों पर लागू होने वाले संज्ञानात्मक परीक्षणों के समान रूप वाले tests को AI पर लागू कर संज्ञानात्मक विविधता और प्रवीणता को मापा गया
- परिणाम मानकीकृत AGI स्कोर(0~100%) के रूप में व्यक्त किए जाते हैं, जहाँ 100% पूर्ण AGI को दर्शाता है
- GPT-4 को 27% और GPT-5 को 57% आँका गया, जिससे तेज प्रगति के साथ-साथ अभी भी बड़े अंतर का पता चलता है
- प्रयोगों में पाया गया कि AI जटिल benchmarks पर उत्कृष्ट है, लेकिन मनुष्यों के लिए सरल मूलभूत संज्ञानात्मक tasks में केवल लगभग आधे ही हल कर पाता है
- इसका अर्थ है कि मौजूदा AI कुछ विशिष्ट क्षेत्रों में बहुत सक्षम है, लेकिन समग्र संज्ञानात्मक चौड़ाई में इसकी बुद्धि संरचना मनुष्यों से संकरी है
10 प्रमुख संज्ञानात्मक घटक
- यह framework CHC की व्यापक क्षमताओं के आधार पर 10 प्रमुख संज्ञानात्मक क्षेत्रों को परिभाषित करता है और प्रत्येक को समान भार(10%) देता है
- सामान्य ज्ञान(General Knowledge, K) : सामान्य जानकारी, संस्कृति, विज्ञान, सामाजिक विज्ञान, इतिहास आदि के बारे में तथ्यात्मक समझ की व्यापकता
- पढ़ने-लिखने की क्षमता(Reading & Writing, RW) : भाषा डिकोडिंग, समझ, लेखन, शैली उपयोग आदि से जुड़ी text processing क्षमता
- गणितीय क्षमता(Mathematical Ability, M) : arithmetic, algebra, geometry, probability, calculus आदि का ज्ञान और समस्या-समाधान क्षमता
- तत्काल तर्क(On-the-Spot Reasoning, R) : पूर्व ज्ञान पर निर्भर हुए बिना नए समस्याओं को हल करने की लचीली attention control क्षमता
- working memory(Working Memory, WM) : text, auditory, visual जानकारी को एक साथ बनाए रखने और संचालित करने की क्षमता
- long-term memory storage(Long-Term Memory Storage, MS) : नई जानकारी को लगातार सीखने और संग्रहित करने की क्षमता
- long-term memory retrieval(Long-Term Memory Retrieval, MR) : संग्रहित ज्ञान को सही ढंग से वापस लाने और hallucination(confabulation) से बचने की क्षमता
- visual processing(Visual Processing, V) : दृश्य जानकारी को पहचानने, विश्लेषित करने, बनाने और खोजने की क्षमता
- auditory processing(Auditory Processing, A) : आवाज़, rhythm, music जैसी श्रव्य उत्तेजनाओं को अलग करने, पहचानने और रचनात्मक रूप से उपयोग करने की क्षमता
- गति(Speed, S) : सरल संज्ञानात्मक tasks को तेजी से करने की क्षमता, जिसमें perceptual speed, reaction time, processing fluency शामिल हैं
- इन 10 क्षेत्रों के जरिए text, visual, auditory को समेटने वाला multimodal मूल्यांकन संभव होता है, और AI की ताकतों व कमजोरियों का सटीक निदान किया जा सकता है
मौजूदा AI का cognitive profile और उसके संकेत
- GPT-4 और GPT-5 की संज्ञानात्मक क्षमताओं की तुलना में पाया गया कि वे ज्ञान-केंद्रित क्षेत्रों में मजबूत हैं, लेकिन memory-संबंधित क्षेत्रों में स्पष्ट रूप से कमजोर हैं
- खास तौर पर long-term memory storage क्षमता को सबसे बड़ी कमी के रूप में चिन्हित किया गया
- यह दिखाता है कि वर्तमान AI में मानव-स्तरीय सामान्य बुद्धि तक पहुँचने के लिए आवश्यक बुनियादी संज्ञानात्मक संरचना का अभाव है
- यह framework AI प्रगति को मात्रात्मक रूप से ट्रैक करने के उपकरण के रूप में इस्तेमाल किया जा सकता है
- AGI स्कोर के जरिए मॉडलों के बीच प्रगति की गति और शेष अंतर को स्पष्ट रूप से मापा जा सकता है
- भविष्य के AI शोध में संतुलित संज्ञानात्मक विकास के महत्व को रेखांकित करने वाले संकेतक के रूप में काम कर सकता है
निष्कर्ष
- यह अध्ययन AGI पर चर्चा की अस्पष्टता को कम करता है और मानव संज्ञान मॉडल पर आधारित एक मात्रात्मक परिभाषा प्रस्तुत करता है
- CHC सिद्धांत पर आधारित 10 संज्ञानात्मक क्षेत्रों के मूल्यांकन के माध्यम से, AI की संज्ञानात्मक चौड़ाई और गहराई को वस्तुनिष्ठ रूप से मापा जा सकता है
- GPT-4 और GPT-5 के परिणाम दिखाते हैं कि AI तेज़ी से प्रगति कर रहा है, लेकिन memory, reasoning, sensory integration जैसी प्रमुख संज्ञानात्मक क्षमताओं में अब भी मनुष्यों से काफी पीछे है
- प्रस्तावित framework में भविष्य के AGI शोध के लिए मानकीकृत मूल्यांकन मानदंड बनने की क्षमता है
1 टिप्पणियां
Hacker News की राय
AGI को ‘अच्छी शिक्षा पाए वयस्क की संज्ञानात्मक विविधता और दक्षता’ के रूप में परिभाषित करना बहुत ज़्यादा बड़ा लक्ष्य लगता है
सच कहें तो बिना शिक्षित बच्चे के स्तर की संज्ञानात्मक क्षमता वाला AI भी बहुत बड़ी उपलब्धि होगा
पशु-स्तर की बुद्धिमत्ता को लागू करना भी मानव इतिहास की दृष्टि से एक बड़ी घटना होगी
अगर सचमुच एक general AI बनाया जाए, तो वह शायद अरबों parameters वाला ऐसा मॉडल होगा जो ऑनलाइन जानकारी खोज सके, ज़रूरत पड़ने पर ही याद रखे, योजना बनाए और ज्ञान का विस्तार करे
उसे 30 भाषाएँ जानने की ज़रूरत नहीं होगी, न ही पूरी Wikipedia याद होने की
ऐसा कुशल मॉडल ही मेरी नज़र में AGI की परिभाषा है
पहले का Turing test भी आखिरकार खामियों वाला साबित हुआ — सिर्फ़ औसत मानव पूछताछकर्ता को पार कर लेने से किसी चीज़ को वास्तविक बुद्धिमत्ता नहीं कहा जा सकता
अगर सचमुच बुद्धिमत्ता (I) को परिभाषित किया जा सके, तो सार्वभौमिकता (G) अपने-आप आ जाएगी
पेपर पढ़कर मुझे जो महसूस हुआ, वह यह कि ‘चेतना (awareness)’ पर कोई चर्चा ही नहीं है
संज्ञान मूल रूप से चेतना की माँग करता है, लेकिन चेतना को भाषा में समझाना या मापना मुश्किल है
बौद्ध धर्म और दर्शन ने हज़ारों साल तक इसकी पड़ताल की है, फिर भी यह अब तक परिभाषित नहीं हो सकी
मेरे पिता psychometrics के प्रोफेसर हैं, और उनका कहना है कि मानव बुद्धिमत्ता को मापने वाले औज़ार ही बहुत अधूरे हैं
भाषा मानव ज्ञान को समेट सकती है, लेकिन ‘चेतना की चिंगारी’ को पकड़ नहीं सकती
ध्यान करने पर पता चलता है कि विचार गायब हो जाने पर भी क्रिया संभव है — ऐसे non-verbal process को मॉडल नहीं सीख सकता
मेरी राय में LLM, अपनी भाषाई prediction संरचना के कारण, ऐसे अचेतन सोच-प्रक्रियाओं को लागू नहीं कर सकता
मानव मस्तिष्क और LLM दोनों ही भीतर उच्च-आयामी concept fusion और vector binding करते हैं
समस्या यह है कि continuous learning, long-term memory, और infinite context processing मौजूद नहीं हैं
अगर ये तीनों हल हो जाएँ, तो हम AGI के एक कदम और करीब होंगे
जब चेतना के अस्तित्व को साबित ही नहीं किया जा सकता, तो उसे आधार मानना अनुत्पादक है
दार्शनिक बहसों का इंतज़ार किए बिना भी हम पहले से सोचने और तर्क करने वाली मशीनें बना रहे हैं
लेकिन AI पर चर्चा हमेशा सिर्फ़ एक तरह की बुद्धिमत्ता पर टिक जाती है
धर्म और ध्यान इस बात पर ज़ोर देते हैं कि ‘चेतना शरीर के भीतर मौजूद है’, लेकिन AGI चर्चा ऐसे अतिक्रमणकारी पहलुओं को दोष की तरह देखती है
चेतना आ गई तो स्वायत्तता और अधिकार भी आ जाएँगे
उद्योग जगत नैतिक ज़िम्मेदारी के बिना एक ‘आज्ञाकारी उपकरण’ चाहता है
मैं सिर्फ़ इस बात को लेकर निश्चित हो सकता हूँ कि मुझमें स्वयं चेतना है
इसलिए चेतना बुद्धिमत्ता का उपयोगी संकेतक नहीं है
मुझे लगता है कि मानव बुद्धिमत्ता को जीवविज्ञान से अलग करके देखना ग़लत है
मानव सोच जैविक अवस्था और विकासवादी चक्रों में गहराई से जड़ें रखती है
शतरंज की क्षमता की तुलना की जा सकती है, लेकिन मानव भावनाएँ और तर्क, तर्कशास्त्र से ज़्यादा जीवविज्ञान के करीब हैं
न भूख, न मृत्यु, न भावनाएँ — इसलिए उसमें स्वयं खोजने या अपने-आप को बेहतर बनाने की आंतरिक प्रेरणा नहीं है
इंसान भीतर से विकसित होता है, जबकि AI को बाहर से train किया जाता है
इसलिए मुझे लगता है कि LLM, मानवीय अर्थों में AGI तक पहुँचना मुश्किल पाएँगे
लेकिन मैं इस धारणा को लेकर संदेह में हूँ
आख़िरकार, ‘बुद्धिमत्ता’ की परिभाषा AI द्वारा दिखाए जा रहे नतीजों के हिसाब से दोबारा परिभाषित की जा सकती है
यह धार्मिक प्रश्न के ज़्यादा करीब है, और हम बस इसका तकनीकी वर्णन भर करते हैं
LLM उस वर्णन के करीब पहुँच सकता है, लेकिन वह वास्तविक बुद्धिमत्ता न भी हो सकता है
मुझे नहीं लगता कि बुद्धिमत्ता मानव जीवविज्ञान से बँधी हुई है
यह पेपर कुछ ऐसा लगता है मानो SAT score और venture capital valuation को मिला दिया गया हो
AGI को “मानव की सभी संज्ञानात्मक क्षमताओं वाला AI” कहना ही पहले से अस्पष्ट है
पेपर कहता है कि वह “AGI की ठोस परिभाषा देता है”, लेकिन फिर भी ‘अच्छी शिक्षा पाए वयस्क’ जैसे धुंधले मानक पर निर्भर है
AI कई क्षेत्रों में पहले ही वयस्क-स्तर से आगे निकल चुका है
पेपर जिस “jagged” cognitive profile की बात करता है, वैसी बात तो हर बुद्धिमत्ता में वातावरण के हिसाब से होती ही है
इसलिए यह AGI की परिभाषा नहीं, बल्कि AI के संज्ञानात्मक असंतुलन को मापने का एक framework भर है
हैरानी की बात यह है कि AI इंसानों की तुलना में कहीं ज़्यादा असंतुलित (jagged) है
AI तकनीकी रूप से दिलचस्प ज़रूर है, लेकिन “AGI आखिर है क्या” वाली चर्चा बहुत उबाऊ है
यह कुछ वैसा लगता है जैसे हर बार quantum computing की बात करते हुए ‘qubit क्या है’ से शुरुआत करनी पड़े
तकनीक कोई अंतिम मंज़िल नहीं, बल्कि लगातार सुधार की प्रक्रिया है
अंततः हर तकनीक पुरानी पड़ जाती है, और बस nostalgia बनकर रह जाती है
AI भी आगे बढ़ता रहेगा, लेकिन हम बस उसकी रफ़्तार के आदी होते जाने वाले उबलते पानी के मेंढक हैं
वह मंज़िल न सही, फिर भी चर्चा के लायक तो है
चेतना और विचार की प्रकृति पर सैकड़ों साल पहले से बहस होती रही है
जो नई अंतर्दृष्टि लगती है, वह दरअसल पुराने दर्शन की ही पुनरावृत्ति है
इस पेपर की बुनियादी ग़लती यह है कि यह इंसानों के लिए बने intelligence measurement tools को मशीनों पर जस का तस लागू करना चाहता है
उदाहरण के लिए, ‘dual N-back test’ इंसानों में working memory के अंतर को मापने के लिए है, लेकिन transformer model के लिए उसका कोई अर्थ नहीं
मानव बुद्धिमत्ता परीक्षण इस धारणा पर बनाए गए हैं कि उनका संबंध इंसानों के वास्तविक दुनिया के प्रदर्शन से होगा
इसलिए AI का IQ test अच्छा होना यह नहीं बताता कि वह वास्तविक दुनिया में उच्च-बुद्धिमान इंसान की तरह व्यवहार कर सकता है
हमारे पास पहले से ही SAGI(Stupid Artificial General Intelligence) है
कुछ मामलों में यह इंसानों से तेज़ या बेहतर है, लेकिन साथ ही मूर्ख भी है
यह कुछ वैसा है जैसे हवाई जहाज़ पक्षी की तरह नहीं उड़ता, फिर भी उड़ सकता है
इस पर When Will AI Transform the Economy? में चर्चा की गई है
गणितज्ञों के ‘Naive Set Theory’ की तरह, यह सरल लेकिन उपयोगी अवधारणा है
दिलचस्प बात यह है कि HN में ज़्यादातर लोग मौजूदा AI को ‘नकली’ या ‘खिलौना’ मानकर खारिज कर देते हैं
लेकिन दुनिया के सबसे सफल लोग इसमें trillions of dollars निवेश कर रहे हैं
कौन सही है, यह तो नहीं पता, लेकिन यह चरम विरोधाभास दिलचस्प है
बेकार चीज़ बनाकर भी सफल हुआ जा सकता है
GPT-5 को 58% score मिला, यह बहुत ज़्यादा लगता है
वास्तव में वह AGI के इतना करीब नहीं है
और Gary Marcus तथा Yoshua Bengio का एक ही पेपर में होना भी अजीब लगता है
आजकल तो author list ही performance जैसी लगती है