Generative AI का Act o1 - एजेंट रीजनिंग के युग की शुरुआत

xguru · 2024-10-21T11:06:01+09:00

Generative AI क्रांति के दूसरे साल में प्रवेश करते हुए, शोध "तेज़ सोच" से "धीमी सोच" की ओर विकसित हो रहा है "तेज़ सोच" का मतलब पहले से प्री-ट्रेंड तेज़ प्रतिक्रियाएं है, जबकि "धीमी सोच" का मतलब inference के समय reasoning करना है इस विकास के कारण नए प्रकार के एजेंट एप्लिकेशन उभर रहे हैं Generative AI बाज़ार की बुनियादी लेयर स्थिर होने के साथ Microsoft/OpenAI, AWS/Anthropic, Meta, Google/DeepMind जैसे कुछ बड़े खिलाड़ी बाज़ार का नेतृत्व कर रहे हैं केवल आर्थिक इंजन और विशाल पूंजी वाले बड़े खिलाड़ी ही प्रतिस्पर्धा में बचे हुए हैं बाज़ार की संरचना खुद अधिक मज़बूत हो रही है, और सस्ता तथा प्रचुर next-token prediction संभव होगा LLM बाज़ार संरचना के स्थिर होने के साथ एक नया frontier उभर रहा है ध्यान अब reasoning layer के विकास और विस्तार पर है, जहां "System 2" सोच को प्राथमिकता दी जाती है AlphaGo जैसे मॉडलों से प्रेरित यह लेयर, AI सिस्टम को साधारण pattern matching से आगे बढ़ाकर सावधानीपूर्ण reasoning, problem solving और cognition देने का लक्ष्य रखती है नई cognitive architecture और user interface यह तय कर रहे हैं कि ये reasoning क्षमताएं उपयोगकर्ताओं तक कैसे पहुंचें और उनके साथ कैसे interact करें Strawberry Fields Forever 2024 का सबसे महत्वपूर्ण मॉडल अपडेट OpenAI का o1 है (पहले Q* के नाम से जाना जाता था और Strawberry भी कहा जाता था) यह सिर्फ इतना नहीं है कि OpenAI मॉडल quality leaderboard में फिर से शीर्ष पर पहुंच गया है, बल्कि इसने मौजूदा architecture में बड़ा सुधार भी किया है विशेष रूप से, यह inference-time compute के जरिए हासिल की गई वास्तविक "general reasoning ability" वाला पहला मॉडल है प्री-ट्रेनिंग मॉडल बनाम inference-time compute प्री-ट्रेनिंग मॉडल विशाल मात्रा के डेटा का उपयोग करके next token prediction करते हैं scale की emergent property के रूप में बुनियादी reasoning उभरती है, लेकिन यह reasoning बहुत सीमित होती है inference-time compute का मतलब है मॉडल से जवाब देने से पहले रुककर सोचने के लिए कहना इसके लिए inference के दौरान अधिक compute की आवश्यकता होती है यही "रुककर सोचना" वाला हिस्सा वास्तव में reasoning है AlphaGo और LLM की तुलना AlphaGo ने मार्च 2016 में सियोल में Go के दिग्गज Lee Sedol के साथ मुकाबला करके deep learning इतिहास के सबसे महत्वपूर्ण क्षणों में से एक बनाया AlphaGo ने दुनिया को ऐसा "सोचने वाला AI" दिखाया जो सिर्फ pattern की नकल करने से कहीं आगे था AlphaGo और उससे पहले के gameplay AI सिस्टम के बीच अंतर AlphaGo भी LLM की तरह लगभग 3 करोड़ पिछले गेम मूव्स के डेटाबेस और self-play के जरिए मानव विशेषज्ञों की नकल करने के लिए pre-train किया गया था लेकिन pre-trained मॉडल से मिलने वाली तत्काल प्रतिक्रिया देने के बजाय, AlphaGo समय लेकर रुकता और सोचता है inference के दौरान, AlphaGo संभावित भविष्य के बहुत से scenario पर search या simulation चलाता है, उन scenario का मूल्यांकन करता है, और फिर सबसे अधिक expected value वाले scenario (या उत्तर) के साथ प्रतिक्रिया देता है AlphaGo को जितना अधिक समय दिया जाए, उसका प्रदर्शन उतना बेहतर होता है inference-time compute के बिना AlphaGo सर्वश्रेष्ठ मानव खिलाड़ियों को नहीं हरा सकता LLM में AlphaGo को दोहराना कठिन क्यों है प्रतिक्रिया का मूल्यांकन करने वाला value function बनाना कठिन है Go में आप पूरे खेल का simulation करके देख सकते हैं कि कौन जीतता है, और फिर अगली चाल की expected value निकाल सकते हैं coding में आप कोड को test करके देख सकते हैं कि वह काम करता है या नहीं लेकिन essay का draft, यात्रा itinerary, या लंबे दस्तावेज़ के मुख्य शब्दों का सार जैसी चीज़ों का मूल्यांकन करना कठिन है यही वजह है कि मौजूदा methodology के साथ reasoning कठिन है, और इसी कारण Strawberry logic के करीब वाले क्षेत्रों (जैसे coding, math, science) में अपेक्षाकृत शक्तिशाली है, लेकिन खुले और असंरचित क्षेत्रों (जैसे writing) में नहीं Strawberry मॉडल की reasoning क्षमता सुधारने के लिए शोध Strawberry का वास्तविक implementation कड़ी सुरक्षा में है, लेकिन इसका मूल विचार मॉडल द्वारा जनरेट की गई chain of thought पर reinforcement learning से जुड़ा है मॉडल की thought chain का audit करना संकेत देता है कि कुछ मूलभूत और रोचक वैसा हो रहा है जो इंसानी सोच और reasoning के तरीके से मिलता-जुलता है उदाहरण के लिए, o1 reasoning-time scaling की emergent property के रूप में अटकने पर पीछे लौट सकने की क्षमता दिखाता है यह इंसानों की तरह समस्याओं के बारे में सोचने की क्षमता भी दिखाता है (जैसे geometry समस्या हल करने के लिए गोले पर बिंदुओं की कल्पना करना), और समस्याओं को नए तरीकों से सोचने की क्षमता भी (जैसे programming contest समस्या को इंसानों से अलग तरीके से हल करना) शोध टीम के पास मॉडल की reasoning क्षमता बढ़ाने के लिए ideas की भरमार है, जैसे reward function की गणना के नए तरीके और generator/verifier gap को कम करने के नए तरीके, ताकि inference-time compute को आगे बढ़ाया जा सके यानी, deep reinforcement learning फिर से केंद्र में आ रहा है, और यही कुल मिलाकर एक नई reasoning layer को संभव बना रहा है System 1 से System 2 Thinking की छलांग पहले से प्रशिक्षित सहज प्रतिक्रियाओं ("System 1") से अधिक गहरी और सावधानीपूर्ण reasoning ("System 2") की ओर छलांग AI की अगली frontier है सिर्फ यह काफी नहीं है कि मॉडल किसी चीज़ को जानता हो मॉडल को real time में निर्णय लेने के लिए रुकना, मूल्यांकन करना और reasoning करना ज़रूरी है प्री-ट्रेनिंग System 1 layer के बराबर है चाहे AlphaGo में लाखों Go चालों को सीखना हो, या LLM में इंटरनेट-स्तरीय text के petabytes को सीखना हो, प्री-ट्रेनिंग का लक्ष्य मानव gameplay या भाषा जैसे pattern की नकल करना है लेकिन नकल, चाहे कितनी भी शक्तिशाली हो, वास्तविक reasoning नहीं है खासकर training dataset के बाहर की जटिल और नई परिस्थितियों में यह सही तरह से सोच नहीं सकती System 2 thinking आधुनिक AI शोध का केंद्र है जब मॉडल "रुककर सोचता" है, तो वह सिर्फ सीखे हुए pattern पैदा नहीं कर रहा होता या पिछले डेटा के आधार पर भविष्यवाणी उगल नहीं रहा होता वह संभावनाओं की एक range बनाता है, संभावित परिणामों पर विचार करता है, और reasoning पर आधारित निर्णय लेता है System 1 thinking और System 2 thinking का उचित उपयोग कई कार्यों में System 1 thinking ही काफी है (जैसे Bhutan की राजधानी क्या है, इस पर ज़्यादा देर सोचने से मदद नहीं मिलेगी) लेकिन math या biology में breakthrough जैसी अधिक जटिल समस्याओं में तेज़ और सहज प्रतिक्रिया पर्याप्त नहीं होती ऐसी प्रगति के लिए गहरी सोच, रचनात्मक problem solving, और सबसे बढ़कर समय चाहिए AI के लिए भी यही सच है। सबसे कठिन और अर्थपूर्ण समस्याओं को हल करने के लिए उसे तेज़, dataset-आधारित प्रतिक्रियाओं से आगे बढ़कर उस विचारपूर्ण reasoning के लिए समय देना होगा जो मानव प्रगति को परिभाषित करती है नया scaling law: reasoning competition की शुरुआत OpenAI के o1 पेपर की सबसे महत्वपूर्ण insight यह है कि एक नया scaling law उभर आया है LLM प्री-ट्रेनिंग के scaling law LLM प्री-ट्रेनिंग एक अच्छी तरह समझे गए scaling law का पालन करती है मॉडल प्री-ट्रेनिंग में जितना अधिक compute और data लगाया जाए, प्रदर्शन उतना बेहतर होता है inference-time compute का नया scaling law o1 पेपर ने compute scaling के लिए एक नया dimension खोला है मॉडल को जितना अधिक reasoning time (या "test time") compute दिया जाता है, उसकी reasoning क्षमता उतनी बेहतर होती है अगर मॉडल कुछ घंटे, कुछ दिन, या कई दशक तक सोच सके तो क्या होगा? क्या वह Riemann hypothesis हल कर सकेगा? क्या वह Asimov के अंतिम प्रश्न का उत्तर दे सकेगा? बड़े प्री-ट्रेनिंग क्लस्टर से reasoning cloud की ओर बदलाव यह परिवर्तन हमें बड़े प्री-ट्रेनिंग क्लस्टर की दुनिया से reasoning cloud की दुनिया में ले जाएगा reasoning cloud ऐसा वातावरण है जो काम की जटिलता के अनुसार compute को dynamically scale कर सकता है क्या एक ही मॉडल सब कुछ नियंत्रित करेगा? OpenAI, Anthropic, Google, Meta आदि जैसे-जैसे reasoning layer का विस्तार कर रहे हैं और अधिक शक्तिशाली reasoning machines बना रहे हैं, तब क्या होगा? क्या एक ही मॉडल सब कुछ नियंत्रित करेगा? एक परिकल्पना यह थी कि कोई एक single-model कंपनी इतनी शक्तिशाली हो जाएगी कि वह बाकी सभी applications को अपने भीतर समेट लेगी अब तक यह भविष्यवाणी दो मायनों में गलत साबित हुई है पहला, model layer में कई प्रतिस्पर्धी हैं जो SOTA capabilities को लेकर लगातार प्रतिस्पर्धा कर रहे हैं यह संभव है कि कोई व्यापक domain self-play के ज़रिए लगातार self-improvement हासिल कर ले और takeoff कर जाए, लेकिन अभी तक इसका कोई प्रमाण नहीं है इसके बजाय, model layer कड़ी प्रतिस्पर्धा का मैदान है, और पिछले Developer Day के बाद से GPT-4 की प्रति token कीमत 98% गिर चुकी है दूसरा, models को application layer में आगे बढ़ने में मुश्किल हो रही है ChatGPT को छोड़कर, models बड़े पैमाने पर application layer में breakthrough products के रूप में स्थापित होने में विफल रहे हैं क्योंकि वास्तविक दुनिया जटिल है बेहतरीन researchers हर संभव vertical market की हर संभव feature के लिए बारीक end-to-end workflows को समझना नहीं चाहते researchers के लिए API पर रुक जाना और वास्तविक दुनिया की जटिलता को developer ecosystem पर छोड़ देना अधिक आकर्षक और आर्थिक रूप से तर्कसंगत है यह application layer के लिए अच्छी खबर है जटिल वास्तविक दुनिया: customized cognitive architecture की आवश्यकता एक scientist के रूप में लक्ष्य हासिल करने के लिए आप जिस तरह actions की योजना बनाते और उन्हें execute करते हैं, वह एक software engineer के रूप में काम करने के तरीके से बहुत अलग है और अलग-अलग कंपनियों में software engineers का काम करने का तरीका भी अलग होता है labs horizontal general-purpose reasoning की सीमाओं को आगे बढ़ा रही हैं, लेकिन उपयोगी AI agents देने के लिए अभी भी application- या domain-specific reasoning की ज़रूरत है जटिल वास्तविक दुनिया में काफ़ी domain- और application-specific reasoning की ज़रूरत होती है, जिसे किसी general model में efficiently encode नहीं किया जा सकता cognitive architecture का उदय cognitive architecture से मतलब है सिस्टम के सोचने का तरीका, यानी user input लेकर actions करने या responses generate करने तक code और model interactions का flow उदाहरण के लिए Factory में, हर "droid" product के पास customized cognitive architecture है, जो इंसानों के सोचने के तरीके की नकल करते हुए pull request review या backend-to-backend service updates के लिए migration plan लिखने और execute करने जैसे specific tasks को हल करता है Factory droids सभी dependencies का analysis करते हैं, संबंधित code changes का सुझाव देते हैं, unit tests जोड़ते हैं, और review के लिए इंसानों को शामिल करते हैं फिर approval के बाद development environment की सभी files में changes execute करते हैं, और सभी tests pass होने पर code को merge कर देते हैं यह किसी generalized, black-box जैसे एक उत्तर के बजाय अलग-अलग tasks की एक श्रृंखला से बनी मानवीय सोच के अधिक समान है App में क्या हो रहा है? AI business शुरू करने के लिए किस layer को target करना चाहिए? infrastructure layer में प्रतिस्पर्धा करने के लिए NVIDIA और hyperscalers को हराना होगा model layer में प्रतिस्पर्धा करने के लिए OpenAI और Mark Zuckerberg को हराना होगा application layer में प्रतिस्पर्धा करने के लिए enterprise IT और global systems integrators को हराना होगा application layer में प्रतिस्पर्धा सबसे अधिक व्यावहारिक लगती है application layer में अवसर foundation models जादुई लगते हैं, लेकिन वे जटिल भी हैं मुख्यधारा के enterprises black boxes, hallucinations, और clunky workflows को संभाल नहीं सकते consumers खाली prompt देखकर नहीं जानते कि क्या माँगना है यही application layer का अवसर है 2 साल पहले, कई application layer कंपनियों पर यह कहकर हमला किया गया था कि वे "GPT-3 के ऊपर सिर्फ wrappers" हैं आज वही wrappers टिकाऊ value बनाने के कुछ गिने-चुने स्वस्थ तरीकों में से एक साबित हुए हैं जो चीज़ "wrapper" के रूप में शुरू हुई थी, वह "cognitive architecture" में विकसित हो गई है application layer AI कंपनियों की विशेषताएँ वे सिर्फ foundation model के ऊपर UI नहीं रखतीं आमतौर पर उनके पास sophisticated cognitive architecture होता है, जिसमें शामिल हैं: कई foundation models, जिनके ऊपर किसी तरह का routing mechanism होता है RAG के लिए vector और/या graph databases compliance सुनिश्चित करने के लिए guardrails workflow के माध्यम से reasoning के तरीके की नकल करने वाला application logic Service-as-a-Software cloud transition, "Software-as-a-Service" था। software कंपनियाँ cloud service providers बन गईं, और यह 350 billion dollar का अवसर था agent reasoning की बदौलत AI transition, "Service-as-a-Software" है। software कंपनियाँ labor को software में बदल रही हैं इसका मतलब है कि target market software market नहीं, बल्कि trillion-dollar service market है काम बेचने का क्या अर्थ है Sierra नाम की कंपनी इसका अच्छा उदाहरण है B2C कंपनियाँ ग्राहकों से बातचीत करने के लिए अपनी websites पर Sierra को deploy करती हैं job-to-be-done ग्राहकों की समस्या हल करना है Sierra प्रति resolved case शुल्क लेती है यहाँ "seat" जैसी कोई चीज़ नहीं है। आपके पास एक job है, Sierra उसे संभालती है, और उसी के अनुसार शुल्क लेती है यही कई AI कंपनियों का असली north star है Sierra की ताकत और दूसरी कंपनियों की चुनौतियाँ Sierra के पास graceful failure mode का लाभ है (human agent को escalation) हर कंपनी इतनी भाग्यशाली नहीं है नया pattern यह है कि पहले pilot mode (human-in-the-loop) में deploy किया जाए, और फिर उस अनुभव का उपयोग करके autopilot (human-out-of-the-loop) deployment के अवसर हासिल किए जाएँ GitHub Copilot इसका अच्छा उदाहरण है नए प्रकार के agent applications उभरने लगे हैं Generative AI की नई reasoning capabilities के साथ नए तरह के agent applications उभरने लगे हैं दिलचस्प बात यह है कि ये application layer कंपनियाँ पिछली cloud कंपनियों से अलग दिखती हैं: cloud कंपनियाँ software revenue को target करती थीं, जबकि AI कंपनियाँ service revenue को target करती हैं cloud कंपनियाँ software ($/seat) बेचती थीं, जबकि AI कंपनियाँ work ($/result) बेचती हैं cloud कंपनियाँ frictionless distribution के साथ bottom-up approach को पसंद करती थीं, जबकि AI कंपनियाँ बढ़ते हुए high-touch, high-trust delivery model के साथ top-down approach अपना रही हैं knowledge economy के हर सेक्टर में उभर रहे agent applications के उदाहरण Harvey: AI वकील Glean: AI work assistant Factory: AI software engineer Abridge: AI medical scribe XBOW: AI penetration tester Sierra: AI customer support agent इन services को प्रदान करने की marginal cost को reasoning cost में तेज़ गिरावट के स्तर तक कम करके, agent applications नए markets का विस्तार कर रहे हैं और उन्हें बना भी रहे हैं XBOW इसका अच्छा उदाहरण है: XBOW AI "pentester" बना रहा है "pentest" या penetration testing, computer systems पर किया जाने वाला simulated cyberattack है, जिसका उपयोग enterprises अपने security systems का मूल्यांकन करने के लिए करते हैं Generative AI से पहले, क्योंकि human pentesting महँगी थी (कुशल लोगों द्वारा किया जाने वाला manual work), कंपनियाँ pentesters को केवल सीमित परिस्थितियों में ही नियुक्त करती थीं, जैसे compliance के लिए आवश्यक होने पर लेकिन अब XBOW latest reasoning LLMs के आधार पर automated pentesting का प्रदर्शन कर रहा है, जो सबसे कुशल human pentesters के प्रदर्शन की बराबरी करता है इससे pentesting market का विस्तार होता है और हर आकार व प्रकार की कंपनियों के लिए continuous pentesting की संभावना खुलती है इसका SaaS इंडस्ट्री पर क्या असर होगा? इस साल की शुरुआत में जब LPs से मुलाकात हुई, तो सबसे ज़्यादा पूछा गया सवाल था: "क्या AI ट्रांज़िशन मौजूदा cloud कंपनियों को नष्ट कर देगा?" हमने एक मज़बूत डिफ़ॉल्ट मान्यता के साथ शुरुआत की: "नहीं" startup और incumbent कंपनियों के बीच क्लासिक लड़ाई ऐसी होती है जैसे startup distribution बनाते हैं और incumbents product बनाते हैं क्या शानदार product वाली युवा कंपनियाँ, ग्राहक के मालिक incumbent कंपनियों के शानदार product लॉन्च करने से पहले ग्राहकों तक पहुँच सकती हैं? यह देखते हुए कि AI का ज़्यादातर जादू foundation models से आ रहा है, हमारी डिफ़ॉल्ट मान्यता "नहीं" थी incumbents के पास भी startups जितनी ही foundation models तक पहुँच है, और उनके पास data व distribution के मौजूदा फायदे भी हैं, इसलिए उनके अच्छा करने की संभावना है startups के लिए मुख्य अवसर मौजूदा software कंपनियों को replace करना नहीं, बल्कि automate किए जा सकने वाले work pool को target करना है लेकिन अब हमें इस बात का उतना भरोसा नहीं है ऊपर cognitive architecture के बारे में कही गई बातों को देखें model की raw capabilities को compelling और reliable end-to-end business solution में बदलने के लिए बहुत बड़े पैमाने की engineering चाहिए क्या हम "AI native" होने का अर्थ बहुत कम करके आँक रहे हैं? 20 साल पहले on-premise software कंपनियाँ SaaS के विचार का मज़ाक उड़ाती थीं "कोई बड़ी बात नहीं। हम भी अपने server चला सकते हैं और इसे internet पर दे सकते हैं!" concept के स्तर पर यह आसान था, लेकिन इसके बाद business का पूरी तरह से पुनर्निर्माण हुआ: EPD ने waterfall model और PRD से agile development और AB testing की ओर शिफ्ट किया GTM ने top-down enterprise sales और steak dinners से bottom-up PLG और product analytics की ओर शिफ्ट किया business model ने high ASP और maintenance streams से high NDR और usage-based pricing की ओर शिफ्ट किया on-premise कंपनियों में से बहुत कम इस ट्रांज़िशन में सफल हो पाईं क्या AI, SaaS जैसा ही एक turning point बन सकता है? क्या AI का अवसर काम बेचते हुए एक साथ software को replace करने का हो सकता है? Day.ai के ज़रिए हमने भविष्य की एक झलक देखी Day एक AI native CRM है system integrators, Salesforce को ग्राहकों की ज़रूरतों के हिसाब से configure करके अरबों डॉलर कमा रहे हैं Day, सिर्फ email और calendar की access तथा एक पेज के questionnaire के जवाबों के आधार पर, अपने-आप ऐसा CRM बना देता है जो ग्राहक के business के लिए पूरी तरह फिट हो इसमें अभी सभी features नहीं हैं, लेकिन बिना मानवीय हस्तक्षेप के हमेशा up-to-date रहने वाले auto-generated CRM का जादू पहले ही लोगों को switch करने का फ़ैसला करा रहा है निवेश उद्योग निवेशक अपना समय और पूंजी कहाँ लगा रहे हैं? इंफ्रास्ट्रक्चर यह hyperscalers का क्षेत्र है यह economic analysis से ज़्यादा game-theoretic behavior से संचालित है venture investors के लिए यह उपयुक्त क्षेत्र नहीं है मॉडल hyperscalers और financial investors (FI) का सक्रिय क्षेत्र hyperscalers अपनी asset balance sheet का उपयोग कर returns कमाते हैं, और निवेश इस तरह करते हैं कि वह cloud business में compute cost के रूप में वापस आए financial investors अक्सर “science से मोहित होने” वाले bias से प्रभावित होते हैं ये models बेहद दिलचस्प हैं और teams भी उत्कृष्ट हैं, लेकिन economic logic को नज़रअंदाज़ किया जाता है डेवलपर टूल्स और इंफ्रास्ट्रक्चर software strategic investors के लिए अपेक्षाकृत कम दिलचस्प, लेकिन venture investors के लिए अधिक आकर्षक cloud ट्रांज़िशन के दौरान, इसी layer में लगभग 15 कंपनियाँ बनीं जिन्होंने $1B+ revenue हासिल किया AI ट्रांज़िशन में भी ऐसा ही होने की उम्मीद है एप्लिकेशन venture investors के लिए सबसे दिलचस्प layer cloud ट्रांज़िशन के दौरान application layer में लगभग 20 कंपनियाँ बनीं जिन्होंने $1B+ revenue हासिल किया mobile ट्रांज़िशन में भी लगभग इतनी ही कंपनियाँ उभरीं, और इस AI ट्रांज़िशन में भी ऐसी ही प्रवृत्ति की उम्मीद है समापन विचार generative AI के अगले चरण में reasoning R&D का प्रभाव application layer में तेज़ी और गहराई से फैलने की उम्मीद है मौजूदा cognitive architectures में मुख्यतः “unhobbling” तकनीकें शामिल थीं, लेकिन अब ये क्षमताएँ खुद model के भीतर समाहित हो रही हैं, इसलिए agent-based applications के और अधिक sophisticated तथा robust होने की संभावना है लैब्स में Reasoning और Inference-Time compute आगे भी महत्वपूर्ण विषय बने रहेंगे, और अब जबकि नए scaling laws सामने आ गए हैं, अगली प्रतिस्पर्धा शुरू हो चुकी है लेकिन कुछ खास domains में real-world data इकट्ठा करना और domain तथा application-specific cognitive architectures को encode करना अब भी कठिन है इन समस्याओं को हल करने में last-mile app providers को बढ़त मिल सकती है आगे चलकर Factory के Droid जैसे multi-agent systems उभर सकते हैं, जो reasoning और social learning process को model करने के तरीके के रूप में फैलेंगे multi-agent systems कई tasks को एक साथ संभालने वाली team बनाकर अधिक काम पूरा कर सकते हैं जिस क्षण का बहुत से लोग इंतज़ार कर रहे हैं, वह है generative AI का ‘Move 37’, यानी वह पल जब एक सामान्य AI system, AlphaGo बनाम Lee Sedol मैच की तरह, अप्रत्याशित रूप से superhuman behavior दिखाए इस पल का आना यह नहीं मतलब होगा कि AI “चेतना” पा लेगा, लेकिन यह संभव है कि AI perception, reasoning और action की प्रक्रिया को simulate करके मौलिक और उपयोगी तरीकों से खोज कर सके यह संभवतः AGI(कृत्रिम बुद्धिमत्ता की पूर्ण स्वायत्तता) हो सकता है, और यह कोई एकल घटना नहीं बल्कि तकनीक के अगले चरण की ओर ले जाने वाला विकास होगा

(sequoiacap.com)

30 पॉइंट द्वारा xguru 2024-10-21 | 4 टिप्पणियां | WhatsApp पर शेयर करें

Generative AI क्रांति के दूसरे साल में प्रवेश करते हुए, शोध "तेज़ सोच" से "धीमी सोच" की ओर विकसित हो रहा है
- "तेज़ सोच" का मतलब पहले से प्री-ट्रेंड तेज़ प्रतिक्रियाएं है, जबकि "धीमी सोच" का मतलब inference के समय reasoning करना है
- इस विकास के कारण नए प्रकार के एजेंट एप्लिकेशन उभर रहे हैं
Generative AI बाज़ार की बुनियादी लेयर स्थिर होने के साथ Microsoft/OpenAI, AWS/Anthropic, Meta, Google/DeepMind जैसे कुछ बड़े खिलाड़ी बाज़ार का नेतृत्व कर रहे हैं
- केवल आर्थिक इंजन और विशाल पूंजी वाले बड़े खिलाड़ी ही प्रतिस्पर्धा में बचे हुए हैं
- बाज़ार की संरचना खुद अधिक मज़बूत हो रही है, और सस्ता तथा प्रचुर next-token prediction संभव होगा
LLM बाज़ार संरचना के स्थिर होने के साथ एक नया frontier उभर रहा है
- ध्यान अब reasoning layer के विकास और विस्तार पर है, जहां "System 2" सोच को प्राथमिकता दी जाती है
- AlphaGo जैसे मॉडलों से प्रेरित यह लेयर, AI सिस्टम को साधारण pattern matching से आगे बढ़ाकर सावधानीपूर्ण reasoning, problem solving और cognition देने का लक्ष्य रखती है
- नई cognitive architecture और user interface यह तय कर रहे हैं कि ये reasoning क्षमताएं उपयोगकर्ताओं तक कैसे पहुंचें और उनके साथ कैसे interact करें

Strawberry Fields Forever

2024 का सबसे महत्वपूर्ण मॉडल अपडेट OpenAI का o1 है (पहले Q* के नाम से जाना जाता था और Strawberry भी कहा जाता था)
- यह सिर्फ इतना नहीं है कि OpenAI मॉडल quality leaderboard में फिर से शीर्ष पर पहुंच गया है, बल्कि इसने मौजूदा architecture में बड़ा सुधार भी किया है
- विशेष रूप से, यह inference-time compute के जरिए हासिल की गई वास्तविक "general reasoning ability" वाला पहला मॉडल है
प्री-ट्रेनिंग मॉडल बनाम inference-time compute
- प्री-ट्रेनिंग मॉडल विशाल मात्रा के डेटा का उपयोग करके next token prediction करते हैं
- scale की emergent property के रूप में बुनियादी reasoning उभरती है, लेकिन यह reasoning बहुत सीमित होती है
- inference-time compute का मतलब है मॉडल से जवाब देने से पहले रुककर सोचने के लिए कहना
- इसके लिए inference के दौरान अधिक compute की आवश्यकता होती है
- यही "रुककर सोचना" वाला हिस्सा वास्तव में reasoning है

AlphaGo और LLM की तुलना

AlphaGo ने मार्च 2016 में सियोल में Go के दिग्गज Lee Sedol के साथ मुकाबला करके deep learning इतिहास के सबसे महत्वपूर्ण क्षणों में से एक बनाया
- AlphaGo ने दुनिया को ऐसा "सोचने वाला AI" दिखाया जो सिर्फ pattern की नकल करने से कहीं आगे था
AlphaGo और उससे पहले के gameplay AI सिस्टम के बीच अंतर
- AlphaGo भी LLM की तरह लगभग 3 करोड़ पिछले गेम मूव्स के डेटाबेस और self-play के जरिए मानव विशेषज्ञों की नकल करने के लिए pre-train किया गया था
- लेकिन pre-trained मॉडल से मिलने वाली तत्काल प्रतिक्रिया देने के बजाय, AlphaGo समय लेकर रुकता और सोचता है
- inference के दौरान, AlphaGo संभावित भविष्य के बहुत से scenario पर search या simulation चलाता है, उन scenario का मूल्यांकन करता है, और फिर सबसे अधिक expected value वाले scenario (या उत्तर) के साथ प्रतिक्रिया देता है
- AlphaGo को जितना अधिक समय दिया जाए, उसका प्रदर्शन उतना बेहतर होता है
- inference-time compute के बिना AlphaGo सर्वश्रेष्ठ मानव खिलाड़ियों को नहीं हरा सकता
LLM में AlphaGo को दोहराना कठिन क्यों है
- प्रतिक्रिया का मूल्यांकन करने वाला value function बनाना कठिन है
- Go में आप पूरे खेल का simulation करके देख सकते हैं कि कौन जीतता है, और फिर अगली चाल की expected value निकाल सकते हैं
- coding में आप कोड को test करके देख सकते हैं कि वह काम करता है या नहीं
- लेकिन essay का draft, यात्रा itinerary, या लंबे दस्तावेज़ के मुख्य शब्दों का सार जैसी चीज़ों का मूल्यांकन करना कठिन है
- यही वजह है कि मौजूदा methodology के साथ reasoning कठिन है, और इसी कारण Strawberry logic के करीब वाले क्षेत्रों (जैसे coding, math, science) में अपेक्षाकृत शक्तिशाली है, लेकिन खुले और असंरचित क्षेत्रों (जैसे writing) में नहीं
Strawberry मॉडल की reasoning क्षमता सुधारने के लिए शोध
- Strawberry का वास्तविक implementation कड़ी सुरक्षा में है, लेकिन इसका मूल विचार मॉडल द्वारा जनरेट की गई chain of thought पर reinforcement learning से जुड़ा है
- मॉडल की thought chain का audit करना संकेत देता है कि कुछ मूलभूत और रोचक वैसा हो रहा है जो इंसानी सोच और reasoning के तरीके से मिलता-जुलता है
- उदाहरण के लिए, o1 reasoning-time scaling की emergent property के रूप में अटकने पर पीछे लौट सकने की क्षमता दिखाता है
- यह इंसानों की तरह समस्याओं के बारे में सोचने की क्षमता भी दिखाता है (जैसे geometry समस्या हल करने के लिए गोले पर बिंदुओं की कल्पना करना), और समस्याओं को नए तरीकों से सोचने की क्षमता भी (जैसे programming contest समस्या को इंसानों से अलग तरीके से हल करना)
- शोध टीम के पास मॉडल की reasoning क्षमता बढ़ाने के लिए ideas की भरमार है, जैसे reward function की गणना के नए तरीके और generator/verifier gap को कम करने के नए तरीके, ताकि inference-time compute को आगे बढ़ाया जा सके
- यानी, deep reinforcement learning फिर से केंद्र में आ रहा है, और यही कुल मिलाकर एक नई reasoning layer को संभव बना रहा है

System 1 से System 2 Thinking की छलांग

पहले से प्रशिक्षित सहज प्रतिक्रियाओं ("System 1") से अधिक गहरी और सावधानीपूर्ण reasoning ("System 2") की ओर छलांग AI की अगली frontier है
सिर्फ यह काफी नहीं है कि मॉडल किसी चीज़ को जानता हो
मॉडल को real time में निर्णय लेने के लिए रुकना, मूल्यांकन करना और reasoning करना ज़रूरी है
प्री-ट्रेनिंग System 1 layer के बराबर है
- चाहे AlphaGo में लाखों Go चालों को सीखना हो, या LLM में इंटरनेट-स्तरीय text के petabytes को सीखना हो, प्री-ट्रेनिंग का लक्ष्य मानव gameplay या भाषा जैसे pattern की नकल करना है
- लेकिन नकल, चाहे कितनी भी शक्तिशाली हो, वास्तविक reasoning नहीं है
- खासकर training dataset के बाहर की जटिल और नई परिस्थितियों में यह सही तरह से सोच नहीं सकती
System 2 thinking आधुनिक AI शोध का केंद्र है
- जब मॉडल "रुककर सोचता" है, तो वह सिर्फ सीखे हुए pattern पैदा नहीं कर रहा होता या पिछले डेटा के आधार पर भविष्यवाणी उगल नहीं रहा होता
- वह संभावनाओं की एक range बनाता है, संभावित परिणामों पर विचार करता है, और reasoning पर आधारित निर्णय लेता है
System 1 thinking और System 2 thinking का उचित उपयोग
- कई कार्यों में System 1 thinking ही काफी है (जैसे Bhutan की राजधानी क्या है, इस पर ज़्यादा देर सोचने से मदद नहीं मिलेगी)
- लेकिन math या biology में breakthrough जैसी अधिक जटिल समस्याओं में तेज़ और सहज प्रतिक्रिया पर्याप्त नहीं होती
- ऐसी प्रगति के लिए गहरी सोच, रचनात्मक problem solving, और सबसे बढ़कर समय चाहिए
- AI के लिए भी यही सच है। सबसे कठिन और अर्थपूर्ण समस्याओं को हल करने के लिए उसे तेज़, dataset-आधारित प्रतिक्रियाओं से आगे बढ़कर उस विचारपूर्ण reasoning के लिए समय देना होगा जो मानव प्रगति को परिभाषित करती है

नया scaling law: reasoning competition की शुरुआत

OpenAI के o1 पेपर की सबसे महत्वपूर्ण insight यह है कि एक नया scaling law उभर आया है
LLM प्री-ट्रेनिंग के scaling law
- LLM प्री-ट्रेनिंग एक अच्छी तरह समझे गए scaling law का पालन करती है
- मॉडल प्री-ट्रेनिंग में जितना अधिक compute और data लगाया जाए, प्रदर्शन उतना बेहतर होता है
inference-time compute का नया scaling law
- o1 पेपर ने compute scaling के लिए एक नया dimension खोला है
- मॉडल को जितना अधिक reasoning time (या "test time") compute दिया जाता है, उसकी reasoning क्षमता उतनी बेहतर होती है
अगर मॉडल कुछ घंटे, कुछ दिन, या कई दशक तक सोच सके तो क्या होगा?
- क्या वह Riemann hypothesis हल कर सकेगा?
- क्या वह Asimov के अंतिम प्रश्न का उत्तर दे सकेगा?
बड़े प्री-ट्रेनिंग क्लस्टर से reasoning cloud की ओर बदलाव
- यह परिवर्तन हमें बड़े प्री-ट्रेनिंग क्लस्टर की दुनिया से reasoning cloud की दुनिया में ले जाएगा
- reasoning cloud ऐसा वातावरण है जो काम की जटिलता के अनुसार compute को dynamically scale कर सकता है

क्या एक ही मॉडल सब कुछ नियंत्रित करेगा?

OpenAI, Anthropic, Google, Meta आदि जैसे-जैसे reasoning layer का विस्तार कर रहे हैं और अधिक शक्तिशाली reasoning machines बना रहे हैं, तब क्या होगा?
क्या एक ही मॉडल सब कुछ नियंत्रित करेगा?
एक परिकल्पना यह थी कि कोई एक single-model कंपनी इतनी शक्तिशाली हो जाएगी कि वह बाकी सभी applications को अपने भीतर समेट लेगी
- अब तक यह भविष्यवाणी दो मायनों में गलत साबित हुई है
- पहला, model layer में कई प्रतिस्पर्धी हैं जो SOTA capabilities को लेकर लगातार प्रतिस्पर्धा कर रहे हैं
  - यह संभव है कि कोई व्यापक domain self-play के ज़रिए लगातार self-improvement हासिल कर ले और takeoff कर जाए, लेकिन अभी तक इसका कोई प्रमाण नहीं है
  - इसके बजाय, model layer कड़ी प्रतिस्पर्धा का मैदान है, और पिछले Developer Day के बाद से GPT-4 की प्रति token कीमत 98% गिर चुकी है
- दूसरा, models को application layer में आगे बढ़ने में मुश्किल हो रही है
  - ChatGPT को छोड़कर, models बड़े पैमाने पर application layer में breakthrough products के रूप में स्थापित होने में विफल रहे हैं
  - क्योंकि वास्तविक दुनिया जटिल है
  - बेहतरीन researchers हर संभव vertical market की हर संभव feature के लिए बारीक end-to-end workflows को समझना नहीं चाहते
  - researchers के लिए API पर रुक जाना और वास्तविक दुनिया की जटिलता को developer ecosystem पर छोड़ देना अधिक आकर्षक और आर्थिक रूप से तर्कसंगत है
  - यह application layer के लिए अच्छी खबर है

जटिल वास्तविक दुनिया: customized cognitive architecture की आवश्यकता

एक scientist के रूप में लक्ष्य हासिल करने के लिए आप जिस तरह actions की योजना बनाते और उन्हें execute करते हैं, वह एक software engineer के रूप में काम करने के तरीके से बहुत अलग है
और अलग-अलग कंपनियों में software engineers का काम करने का तरीका भी अलग होता है
labs horizontal general-purpose reasoning की सीमाओं को आगे बढ़ा रही हैं, लेकिन उपयोगी AI agents देने के लिए अभी भी application- या domain-specific reasoning की ज़रूरत है
जटिल वास्तविक दुनिया में काफ़ी domain- और application-specific reasoning की ज़रूरत होती है, जिसे किसी general model में efficiently encode नहीं किया जा सकता
cognitive architecture का उदय
- cognitive architecture से मतलब है सिस्टम के सोचने का तरीका, यानी user input लेकर actions करने या responses generate करने तक code और model interactions का flow
- उदाहरण के लिए Factory में, हर "droid" product के पास customized cognitive architecture है, जो इंसानों के सोचने के तरीके की नकल करते हुए pull request review या backend-to-backend service updates के लिए migration plan लिखने और execute करने जैसे specific tasks को हल करता है
- Factory droids सभी dependencies का analysis करते हैं, संबंधित code changes का सुझाव देते हैं, unit tests जोड़ते हैं, और review के लिए इंसानों को शामिल करते हैं
- फिर approval के बाद development environment की सभी files में changes execute करते हैं, और सभी tests pass होने पर code को merge कर देते हैं
- यह किसी generalized, black-box जैसे एक उत्तर के बजाय अलग-अलग tasks की एक श्रृंखला से बनी मानवीय सोच के अधिक समान है

App में क्या हो रहा है?

AI business शुरू करने के लिए किस layer को target करना चाहिए?
- infrastructure layer में प्रतिस्पर्धा करने के लिए NVIDIA और hyperscalers को हराना होगा
- model layer में प्रतिस्पर्धा करने के लिए OpenAI और Mark Zuckerberg को हराना होगा
- application layer में प्रतिस्पर्धा करने के लिए enterprise IT और global systems integrators को हराना होगा
- application layer में प्रतिस्पर्धा सबसे अधिक व्यावहारिक लगती है
application layer में अवसर
- foundation models जादुई लगते हैं, लेकिन वे जटिल भी हैं
- मुख्यधारा के enterprises black boxes, hallucinations, और clunky workflows को संभाल नहीं सकते
- consumers खाली prompt देखकर नहीं जानते कि क्या माँगना है
- यही application layer का अवसर है
2 साल पहले, कई application layer कंपनियों पर यह कहकर हमला किया गया था कि वे "GPT-3 के ऊपर सिर्फ wrappers" हैं
- आज वही wrappers टिकाऊ value बनाने के कुछ गिने-चुने स्वस्थ तरीकों में से एक साबित हुए हैं
- जो चीज़ "wrapper" के रूप में शुरू हुई थी, वह "cognitive architecture" में विकसित हो गई है
application layer AI कंपनियों की विशेषताएँ
- वे सिर्फ foundation model के ऊपर UI नहीं रखतीं
- आमतौर पर उनके पास sophisticated cognitive architecture होता है, जिसमें शामिल हैं:
  - कई foundation models, जिनके ऊपर किसी तरह का routing mechanism होता है
  - RAG के लिए vector और/या graph databases
  - compliance सुनिश्चित करने के लिए guardrails
  - workflow के माध्यम से reasoning के तरीके की नकल करने वाला application logic

Service-as-a-Software

cloud transition, "Software-as-a-Service" था। software कंपनियाँ cloud service providers बन गईं, और यह 350 billion dollar का अवसर था
agent reasoning की बदौलत AI transition, "Service-as-a-Software" है। software कंपनियाँ labor को software में बदल रही हैं
इसका मतलब है कि target market software market नहीं, बल्कि trillion-dollar service market है
काम बेचने का क्या अर्थ है
- Sierra नाम की कंपनी इसका अच्छा उदाहरण है
- B2C कंपनियाँ ग्राहकों से बातचीत करने के लिए अपनी websites पर Sierra को deploy करती हैं
- job-to-be-done ग्राहकों की समस्या हल करना है
- Sierra प्रति resolved case शुल्क लेती है
- यहाँ "seat" जैसी कोई चीज़ नहीं है। आपके पास एक job है, Sierra उसे संभालती है, और उसी के अनुसार शुल्क लेती है
- यही कई AI कंपनियों का असली north star है
Sierra की ताकत और दूसरी कंपनियों की चुनौतियाँ
- Sierra के पास graceful failure mode का लाभ है (human agent को escalation)
- हर कंपनी इतनी भाग्यशाली नहीं है
- नया pattern यह है कि पहले pilot mode (human-in-the-loop) में deploy किया जाए, और फिर उस अनुभव का उपयोग करके autopilot (human-out-of-the-loop) deployment के अवसर हासिल किए जाएँ
- GitHub Copilot इसका अच्छा उदाहरण है

नए प्रकार के agent applications उभरने लगे हैं

Generative AI की नई reasoning capabilities के साथ नए तरह के agent applications उभरने लगे हैं
दिलचस्प बात यह है कि ये application layer कंपनियाँ पिछली cloud कंपनियों से अलग दिखती हैं:
- cloud कंपनियाँ software revenue को target करती थीं, जबकि AI कंपनियाँ service revenue को target करती हैं
- cloud कंपनियाँ software ($/seat) बेचती थीं, जबकि AI कंपनियाँ work ($/result) बेचती हैं
- cloud कंपनियाँ frictionless distribution के साथ bottom-up approach को पसंद करती थीं, जबकि AI कंपनियाँ बढ़ते हुए high-touch, high-trust delivery model के साथ top-down approach अपना रही हैं
knowledge economy के हर सेक्टर में उभर रहे agent applications के उदाहरण
- Harvey: AI वकील
- Glean: AI work assistant
- Factory: AI software engineer
- Abridge: AI medical scribe
- XBOW: AI penetration tester
- Sierra: AI customer support agent
इन services को प्रदान करने की marginal cost को reasoning cost में तेज़ गिरावट के स्तर तक कम करके, agent applications नए markets का विस्तार कर रहे हैं और उन्हें बना भी रहे हैं
XBOW इसका अच्छा उदाहरण है:
- XBOW AI "pentester" बना रहा है
- "pentest" या penetration testing, computer systems पर किया जाने वाला simulated cyberattack है, जिसका उपयोग enterprises अपने security systems का मूल्यांकन करने के लिए करते हैं
- Generative AI से पहले, क्योंकि human pentesting महँगी थी (कुशल लोगों द्वारा किया जाने वाला manual work), कंपनियाँ pentesters को केवल सीमित परिस्थितियों में ही नियुक्त करती थीं, जैसे compliance के लिए आवश्यक होने पर
- लेकिन अब XBOW latest reasoning LLMs के आधार पर automated pentesting का प्रदर्शन कर रहा है, जो सबसे कुशल human pentesters के प्रदर्शन की बराबरी करता है
- इससे pentesting market का विस्तार होता है और हर आकार व प्रकार की कंपनियों के लिए continuous pentesting की संभावना खुलती है

इसका SaaS इंडस्ट्री पर क्या असर होगा?

इस साल की शुरुआत में जब LPs से मुलाकात हुई, तो सबसे ज़्यादा पूछा गया सवाल था: "क्या AI ट्रांज़िशन मौजूदा cloud कंपनियों को नष्ट कर देगा?"
हमने एक मज़बूत डिफ़ॉल्ट मान्यता के साथ शुरुआत की: "नहीं"
- startup और incumbent कंपनियों के बीच क्लासिक लड़ाई ऐसी होती है जैसे startup distribution बनाते हैं और incumbents product बनाते हैं
- क्या शानदार product वाली युवा कंपनियाँ, ग्राहक के मालिक incumbent कंपनियों के शानदार product लॉन्च करने से पहले ग्राहकों तक पहुँच सकती हैं?
- यह देखते हुए कि AI का ज़्यादातर जादू foundation models से आ रहा है, हमारी डिफ़ॉल्ट मान्यता "नहीं" थी
- incumbents के पास भी startups जितनी ही foundation models तक पहुँच है, और उनके पास data व distribution के मौजूदा फायदे भी हैं, इसलिए उनके अच्छा करने की संभावना है
- startups के लिए मुख्य अवसर मौजूदा software कंपनियों को replace करना नहीं, बल्कि automate किए जा सकने वाले work pool को target करना है
लेकिन अब हमें इस बात का उतना भरोसा नहीं है
- ऊपर cognitive architecture के बारे में कही गई बातों को देखें
- model की raw capabilities को compelling और reliable end-to-end business solution में बदलने के लिए बहुत बड़े पैमाने की engineering चाहिए
- क्या हम "AI native" होने का अर्थ बहुत कम करके आँक रहे हैं?
20 साल पहले on-premise software कंपनियाँ SaaS के विचार का मज़ाक उड़ाती थीं
- "कोई बड़ी बात नहीं। हम भी अपने server चला सकते हैं और इसे internet पर दे सकते हैं!"
- concept के स्तर पर यह आसान था, लेकिन इसके बाद business का पूरी तरह से पुनर्निर्माण हुआ:
  - EPD ने waterfall model और PRD से agile development और AB testing की ओर शिफ्ट किया
  - GTM ने top-down enterprise sales और steak dinners से bottom-up PLG और product analytics की ओर शिफ्ट किया
  - business model ने high ASP और maintenance streams से high NDR और usage-based pricing की ओर शिफ्ट किया
- on-premise कंपनियों में से बहुत कम इस ट्रांज़िशन में सफल हो पाईं
क्या AI, SaaS जैसा ही एक turning point बन सकता है? क्या AI का अवसर काम बेचते हुए एक साथ software को replace करने का हो सकता है?
Day.ai के ज़रिए हमने भविष्य की एक झलक देखी
- Day एक AI native CRM है
- system integrators, Salesforce को ग्राहकों की ज़रूरतों के हिसाब से configure करके अरबों डॉलर कमा रहे हैं
- Day, सिर्फ email और calendar की access तथा एक पेज के questionnaire के जवाबों के आधार पर, अपने-आप ऐसा CRM बना देता है जो ग्राहक के business के लिए पूरी तरह फिट हो
- इसमें अभी सभी features नहीं हैं, लेकिन बिना मानवीय हस्तक्षेप के हमेशा up-to-date रहने वाले auto-generated CRM का जादू पहले ही लोगों को switch करने का फ़ैसला करा रहा है

निवेश उद्योग

निवेशक अपना समय और पूंजी कहाँ लगा रहे हैं?
इंफ्रास्ट्रक्चर
- यह hyperscalers का क्षेत्र है
- यह economic analysis से ज़्यादा game-theoretic behavior से संचालित है
- venture investors के लिए यह उपयुक्त क्षेत्र नहीं है
मॉडल
- hyperscalers और financial investors (FI) का सक्रिय क्षेत्र
- hyperscalers अपनी asset balance sheet का उपयोग कर returns कमाते हैं, और निवेश इस तरह करते हैं कि वह cloud business में compute cost के रूप में वापस आए
- financial investors अक्सर “science से मोहित होने” वाले bias से प्रभावित होते हैं
- ये models बेहद दिलचस्प हैं और teams भी उत्कृष्ट हैं, लेकिन economic logic को नज़रअंदाज़ किया जाता है
डेवलपर टूल्स और इंफ्रास्ट्रक्चर software
- strategic investors के लिए अपेक्षाकृत कम दिलचस्प, लेकिन venture investors के लिए अधिक आकर्षक
- cloud ट्रांज़िशन के दौरान, इसी layer में लगभग 15 कंपनियाँ बनीं जिन्होंने $1B+ revenue हासिल किया
- AI ट्रांज़िशन में भी ऐसा ही होने की उम्मीद है
एप्लिकेशन
- venture investors के लिए सबसे दिलचस्प layer
- cloud ट्रांज़िशन के दौरान application layer में लगभग 20 कंपनियाँ बनीं जिन्होंने $1B+ revenue हासिल किया
- mobile ट्रांज़िशन में भी लगभग इतनी ही कंपनियाँ उभरीं, और इस AI ट्रांज़िशन में भी ऐसी ही प्रवृत्ति की उम्मीद है

समापन विचार

generative AI के अगले चरण में reasoning R&D का प्रभाव application layer में तेज़ी और गहराई से फैलने की उम्मीद है
मौजूदा cognitive architectures में मुख्यतः “unhobbling” तकनीकें शामिल थीं, लेकिन अब ये क्षमताएँ खुद model के भीतर समाहित हो रही हैं, इसलिए agent-based applications के और अधिक sophisticated तथा robust होने की संभावना है
लैब्स में Reasoning और Inference-Time compute आगे भी महत्वपूर्ण विषय बने रहेंगे, और अब जबकि नए scaling laws सामने आ गए हैं, अगली प्रतिस्पर्धा शुरू हो चुकी है
लेकिन कुछ खास domains में real-world data इकट्ठा करना और domain तथा application-specific cognitive architectures को encode करना अब भी कठिन है
इन समस्याओं को हल करने में last-mile app providers को बढ़त मिल सकती है
आगे चलकर Factory के Droid जैसे multi-agent systems उभर सकते हैं, जो reasoning और social learning process को model करने के तरीके के रूप में फैलेंगे
multi-agent systems कई tasks को एक साथ संभालने वाली team बनाकर अधिक काम पूरा कर सकते हैं
जिस क्षण का बहुत से लोग इंतज़ार कर रहे हैं, वह है generative AI का ‘Move 37’, यानी वह पल जब एक सामान्य AI system, AlphaGo बनाम Lee Sedol मैच की तरह, अप्रत्याशित रूप से superhuman behavior दिखाए
इस पल का आना यह नहीं मतलब होगा कि AI “चेतना” पा लेगा, लेकिन यह संभव है कि AI perception, reasoning और action की प्रक्रिया को simulate करके मौलिक और उपयोगी तरीकों से खोज कर सके
यह संभवतः AGI(कृत्रिम बुद्धिमत्ता की पूर्ण स्वायत्तता) हो सकता है, और यह कोई एकल घटना नहीं बल्कि तकनीक के अगले चरण की ओर ले जाने वाला विकास होगा

4 टिप्पणियां

lsw4uto 2024-11-11

यह उम्मीद की जा रही है कि लगातार अधिक स्मार्ट होती AI किन समस्याओं को हल कर सकेगी।

aer0700 2024-10-27

अगर मॉडल लंबे समय तक सोचकर रीमान परिकल्पना को हल कर सके, तो उसका प्रभाव बेहद बड़ा होगा।

pmc7777 2024-10-21

मॉडल लेयर में प्रतिस्पर्धा करनी है तो OpenAI और Mark Zuckerberg को हराना होगा

Meta नहीं, बल्कि Zuckerberg का ज़िक्र किया गया है, ये थोड़ा मज़ेदार है lol

kotzen 2024-10-21

सारांश लेख में यह बात साफ़ तौर पर नहीं आई है, इसलिए एहतियातन लिख रहा हूँ: System 1 और System 2, Thinking, Fast and Slow नाम की किताब में आए कॉन्सेप्ट हैं.
System 1: बिना गहराई से सोचे अवचेतन या सहज रूप से काम करने वाली तेज़ सोच ex) ड्राइविंग, चलना
System 2: तर्क के साथ गहराई से सोचना पड़ने वाली धीमी सोच ex) मन में गणना करना