Rich Sutton की AI रचनात्मकता और खोज

(twitter.com/RichardSSutton)

5 पॉइंट द्वारा GN⁺ 2026-06-11 | 1 टिप्पणियां | WhatsApp पर शेयर करें

supervised learning से प्रशिक्षित generative AI ऐसे imitation models हैं जो उदाहरणों के समान व्यवहार करते हैं; उपयोगी होने के बावजूद विज्ञान और गणित में नई खोजों के लिए इनमें सीमाएँ हैं
इंटरनेट जवाबों या दस्तावेज़ सारांशों में नवीनता अक्सर hallucination बन जाती है, और अच्छे उत्तरों की गुणवत्ता source material की गुणवत्ता से आती है
उपन्यास या image generation जैसे मामलों में, जहाँ नवीनता चाहिए, यह जानना कठिन है कि आउटपुट training data के कितना करीब है; randomness नवीनता तो बनाती है, लेकिन evaluation के बिना वह अच्छी खोज नहीं बनती
AlphaGo, AlphaZero, GT-Sophy, AlphaFold, AlphaProof, Claude-Code, RL-Lyft जैसे सिस्टम evaluation और selective retention के ज़रिए नए और अच्छे नतीजे खोजते हैं
अगर पूरी तरह सक्षम AI scientist चाहिए, तो स्पष्ट goals साझा करने होंगे ताकि AI बना सके, मूल्यांकन कर सके और खोज कर सके; इसके लिए रचनात्मकता और खोज का automation ज़रूरी है

generative AI की सीमाएँ और उपयोगिता

generative AI बड़े पैमाने पर उदाहरण लेकर इंसानों की तरह टेक्स्ट, कलाकारों या प्रकृति जैसी images, या इंटरनेट वीडियो जैसे videos बनाने वाले imitation models हैं
generative AI बहुत उपयोगी हो सकते हैं, लेकिन पुराना मज़ाक कि “अच्छा हिस्सा नया नहीं होता और नया हिस्सा अच्छा नहीं होता” काफी हद तक यहाँ लागू होता है
इंटरनेट से जवाब ढूँढने या दस्तावेज़ों का सारांश बनाने में AI को नया होने की ज़रूरत नहीं होती, और उत्तर की गुणवत्ता दस्तावेज़ लेखक या इंटरनेट पोस्ट जैसे source material से आती है
अगर AI उत्तर source material से आगे बढ़कर कुछ जोड़ता है, तो वही hallucination है, और ज़्यादातर मामलों में उपयोगकर्ता AI की गढ़ी हुई बातें नहीं चाहते

नवीनता, randomness और evaluation की समस्या

जब उपयोगकर्ता तथ्य या वास्तविकता नहीं बल्कि उपन्यास और मनोरंजन चाहते हैं, तब नवीनता अपवादस्वरूप ज़रूरी होती है
बच्चे के लिए सोने से पहले की कहानी, या ऐसी image जो मौजूदा इंटरनेट images से अलग हो लेकिन उन्हीं पर आधारित हो, generative AI से मांगी जा सकती है
इंटरनेट इतना बड़ा है और संभावित स्रोत इतने अधिक हैं कि AI की कहानी, कविता या image वास्तव में कितनी रचनात्मक है, यह व्यवहारिक रूप से जानना कठिन है
generative AI की processing कुछ हद तक stochastic होती है, इसलिए हर निर्णय कई दिशाओं में जा सकता है और हर बार अलग trajectory बना सकता है
अगर trajectory randomness पर आधारित हो तो वह नई हो सकती है, और अगर training data पर आधारित हो तो data की गुणवत्ता के कारण अच्छी हो सकती है, लेकिन दोनों एक साथ होना मुश्किल है

विज्ञान और गणित के लिए ज़रूरी खोज

भले ही generative AI एक साथ अच्छा और नया न हो सके, फिर भी अधिकांश उपयोगों में यह घातक समस्या नहीं है; अगर यह तेज़, सस्ता, छोटा, अनुकूलित करने योग्य और replicate करने योग्य हो, तो यह transformative technology बन सकता है
विज्ञान और गणित में सिर्फ imitation AI काफ़ी नहीं है; वहाँ वास्तविक रचनात्मकता और खोज की ज़रूरत है
AlphaGo की move 37, AlphaZero की मौलिक chess style, और GT-Sophy का simulation racing performance ऐसे उदाहरण हैं जहाँ कुछ नया और अच्छा मिला
AlphaFold, AlphaProof, Claude-Code को विज्ञान, गणित और programming में वास्तविक प्रगति लाने वाले उदाहरणों के रूप में पेश किया गया है
RL-Lyft एक ऐसा सिस्टम है जो ride-hailing business में यात्रियों को गाड़ियाँ आवंटित करने के तरीके को optimize करता है
कुछ language models को supervised-learning-आधारित generative AI से आगे बढ़ने वाले तरीकों से सुदृढ़ किया गया है

खोज के तीन चरण

खोज वह प्रक्रिया है जिसमें कई चीज़ें आज़माई जाती हैं, देखा जाता है कि क्या काम करता है, और फिर जो सबसे अच्छा काम करे उसे रखा जाता है
प्राकृतिक चयन द्वारा evolution, scientific method, और रोज़मर्रा का जीवन व सीखना—सब कोशिश करने और जो काम करे उसे याद रखने के तरीके से चलते हैं
मनोविज्ञान में इसे instrumental learning या operant conditioning कहा जाता है, और machine learning में इसे reinforcement learning कहा जाता है
planning और combinatorial search में भी “generate and test” वाला खोज का विचार काम करता है
खोज का सार variation, evaluation, और selective retention—इन तीन चरणों के संयोजन में है
केवल supervised learning से runtime पर उत्पन्न चीज़ों का मूल्यांकन करने का तरीका नहीं मिलता; evaluation नहीं होगा तो selective retention भी नहीं होगा, और इसलिए खोज भी नहीं होगी
नवीनता थोड़ी देर के लिए उभर सकती है, लेकिन अगर उसकी value पहचानी न जाए तो वह गायब हो जाती है और खो जाती है

evaluation, goals और autonomy

जब कोई इंसान generative AI से कई चित्र बनवाता है और उनमें से एक पसंद कर चुन लेता है, तो discovery मानव+AI सिस्टम पूरा करता है
जब goal स्पष्ट हो, तब evaluation संभव है; कुछ चालें checkmate तक ले जाती हैं, कुछ चरण proof तक, और कुछ actions ऊँचे reward तक
कुछ genotypes अधिक replication कराते हैं, और कुछ theories data को बेहतर समझाती हैं
variation का पूरी तरह random होना ज़रूरी नहीं; अच्छा वैज्ञानिक परीक्षण के लिए theories को यूँ ही नहीं चुनता
अगर जवाब कहाँ है यह पूरी तरह तय हो, तो वह discovery नहीं है; discovery के लिए uncertainty ज़रूरी है
backpropagation में weight updates deterministic होते हैं, लेकिन weights छोटे random values से initialize किए जाते हैं, इसलिए variation मौजूद रहता है
random initialization, अच्छी performance पाने के लिए सही ढंग से किया जाने वाला variation का आवश्यक रूप है
backpropagation में variation केवल network initialization के समय एक बार होता है, इसलिए उसका प्रभाव अस्थायी होता है और बाद में network सीखने की क्षमता खो सकता है
“continual backpropagation” कम इस्तेमाल होने वाले neurons को कभी-कभी छोटे random weights से फिर initialize करता है, ताकि variation जारी रहे और plasticity बनी रहे
discovery के लिए इंसानों या explicit goals से आने वाला evaluation चाहिए, और पूरी autonomy तब संभव है जब explicit goals evaluation उपलब्ध कराएँ
अगर आप AI scientist की पूरी क्षमता चाहते हैं, तो goals साझा करने होंगे ताकि AI बना सके, मूल्यांकन कर सके, खोज कर सके और goal प्राप्ति में भाग ले सके

1 टिप्पणियां

GN⁺ 2026-06-11

Hacker News की राय

coding की तरह सबसे सफल applications शुद्ध LLM/जनरेटिव मॉडलिंग का नतीजा नहीं हैं, बल्कि agentic harness के साथ loop को बंद करने से आते हैं
generate-test-selective improvement loop वैज्ञानिक काम का मुख्य पैटर्न है, और LLM + verifiable reward के साथ reinforcement learning + compiler/terminal execution feedback इस प्रक्रिया की काफ़ी अच्छी नकल करते हैं
यह आधुनिक computational systems पर लागू Fisher/Box feedback loop(https://www-sop.inria.fr/members/Ian.Jermyn/philosophy/writi...) के ज़्यादा क़रीब है, और LLM तो बस एक component है
काश Sutton ने अभी की पूरी तस्वीर पर बात की होती; सिर्फ़ LLM/backpropagation पक्ष तक सीमित रहना थोड़ा खटकता है। सच में जिज्ञासा है कि क्या ऐसे loop discovery को कम-से-कम आंशिक रूप से automate कर सकते हैं
discovery में और भी कई तत्व होते हैं, और शुरुआती working model/hypothesis कहाँ से आते हैं या updates कैसे चुने जाते हैं, यह अब भी साफ़ नहीं है। देखा था कि हाल की Hanson की Patterns of Discovery उस दिशा पर बात करती है, हालाँकि अभी पढ़ी नहीं है, लेकिन जानना चाहता हूँ कि उसमें कोई mechanical clue है या नहीं
- शुरुआती model/hypothesis कहाँ से आते हैं और updates कैसे चुने जाते हैं, यह reinforcement learning में भी समस्या है, इसलिए आम तौर पर पहले supervised learning से कुछ trajectories की नकल करना सिखाया जाता है और फिर reinforcement learning से model को refine किया जाता है
  सिर्फ़ reinforcement learning में reward तक पहुँचना मुश्किल होता है, इसलिए शुद्ध RL से task सीखना बड़ी समस्या है। इंसान भी discovery की समस्या को किताबों से मिलने वाले supervisory signal और problem-solving search को मिलाकर हल करते हैं, और जिसे mathematics की कोई शुरुआती शिक्षा ही न मिली हो, वह चाहे कितना भी intelligent हो, असाधारण नतीजे निकालना मुश्किल पाएगा। bootstrap दरअसल अतीत में पहले ही paid-for exploration था
- harness के महत्व से पूरी तरह सहमत हूँ
  लेकिन इसमें वही समस्या दिखती है जो evolutionary algorithms में थी। आप पैसे ख़त्म होने तक candidate solutions generate कर सकते हैं, लेकिन फिर भी उन solutions का evaluation करना पड़ेगा। एक fitness function चाहिए, और इसका मतलब है कि कम-से-कम solution का मोटा आकार तो पहले से पता होना चाहिए। अगर किसी को ज़्यादा open-ended fitness functions पर काम मालूम हो, तो पढ़ना चाहूँगा
- LLM के आलोचक शोधकर्ता ज़्यादातर LLM की बुनियादी mathematical/structural properties पर सवाल उठाते हैं, लेकिन model के आसपास उसे उपयोगी बनाने के लिए हो रही engineering को नज़रअंदाज़ करते दिखते हैं
  उन गणितीय सीमाओं की वजह से LLM शायद असली AGI तक पहुँचने का रास्ता न हो, लेकिन इस समय ईमानदारी से कहूँ तो यह बात उतनी महत्वपूर्ण नहीं लगती
- सबसे महत्वपूर्ण बिंदु यह है कि reinforcement loop learning के दौरान इस्तेमाल होता है। Sutton की मूल hypothesis से मैं सहमत नहीं हूँ, लेकिन reinforcement learning के बाद वह hypothesis और कमज़ोर हो जाती है
यह framing मुझे बहुत पसंद आई कि “नई उत्पन्न चीज़ों का मूल्यांकन होना चाहिए, तभी creativity बनती है। evaluation और सर्वोत्तम परिणामों के preservation के बिना कुछ भी create नहीं होता। novelty पल भर को उभरती है, लेकिन अगर उसकी value को पहचाना न जाए तो वह गुम होकर खो जाती है”
Twitter comments में बहुत से लोग, शायद यहाँ कुछ लोग भी, लगता है introduction के बाद आगे पढ़े ही नहीं। वह यह नहीं कह रहे कि AI systems creativity और discovery नहीं कर सकते, बल्कि यह कह रहे हैं कि harness के बिना generative AI creativity और discovery नहीं कर सकता
मतलब यह कि नई ideas की value को पहचानने और याद रखने वाला कोई दूसरा system चाहिए। वह ऐसे उदाहरण भी देते हैं जहाँ यह value-recognition step automate हो जाता है, और self-defined अर्थ में पूरी तरह automated system में creativity और discovery हासिल होती है
- मोटे तौर पर सहमत हूँ, लेकिन generative AI की ऐसी संकरी परिभाषा लेकर यह तर्क देना, जो उसके वास्तविक उपयोग से मेल ही नहीं खाती, strawman argument बन जाता है
अगर मैं कुछ मिस नहीं कर रहा, तो यह दावा सिर्फ़ मूल pretraining era (जैसे GPT 1~4) पर लागू होता दिखता है। क्या post-training और reinforcement learning paradigm साफ़ तौर पर variation, evaluation, और selective preservation नहीं कर रहे?
- मूल लेख शायद verifiable reward के साथ reinforcement learning (RLVR) जैसे post-training चरणों को नज़रअंदाज़ करता है। बेशक मेरा यह कहने का इरादा नहीं कि Rich Sutton को इन चीज़ों का पता नहीं होगा। RLVR में evaluation का तरीका काफ़ी संकरा होता है
  सोच रहा हूँ कि क्या यह Keen Tech के David Silver की Ineffable Intelligence approach की ओर झुकने का संकेत है
- RLVR अभी भी base distribution से आगे नहीं बढ़ पाता और उसी के भीतर mode ढूँढ़ता है
  यानी evaluation और preservation तो है, लेकिन variation या “planning” नहीं है
  इसका मतलब यह नहीं कि LLM बेकार हैं। AlphaEvolve ठीक यही करता है। बस वह बाहर का एक simple evolutionary planner इस्तेमाल करता है। उसका बड़ा बिंदु यह है कि हमारा planner अभी भी “मूर्ख” है, और यहीं ज़्यादा निवेश होना चाहिए
  Claude Code में जब LLM को बार-बार दिशा दी जाती है, तो user बाहरी planner की भूमिका निभाता है, और वह भी अच्छी तरह काम करता है
AlphaGo और ऐसे generative AI models जिन समस्याओं का सामना करते हैं, उन्हें लेकर problem setting कुछ अजीब लगती है
AlphaGo को बाहर से दी गई सख्त evaluation मिली थी, उसने वह खुद नहीं बनाई थी
generative AI models भी अगर बाहर से सख्त evaluation पाएँ, तो कई क्षेत्रों में सफल हो सकते हैं। साधारण programming tasks से लेकर frontier mathematics (हाल में conjecture का counterexample पेश करना), और अधिक optimized kernel code लिखने तक, यह बात कि वे इतने अलग-अलग क्षेत्रों में सफल होते हैं, खास तौर पर चौंकाने वाली है
जिन क्षेत्रों में solution बेहद जटिल होता है लेकिन evaluation तुलनात्मक रूप से कम जटिल होती है, वहाँ reinforcement learning भी बहुत है, और discovery तथा “evolution-जैसे” trajectory selection भी वास्तव में होता है
इसलिए AlphaGo से तुलना करना अजीब लगता है। AlphaGo को एक संकीर्ण क्षेत्र में इंसानों जैसे बाहरी स्रोत द्वारा दी गई, उससे स्वतंत्र, सख्त evaluation मिली थी। generative AI को भी अगर ऐसी evaluation दी जाए, तो वह काफ़ी हैरान करने वाले नतीजे दिखा सकता है
इससे भी अजीब बात यह है कि कई मामलों में innovation और progress वास्तव में पूरी तरह नए ideas की माँग नहीं करते, बल्कि अलग-अलग methods, tactics और ideas को high quality में परत-दर-परत लागू करने से आते हैं। बहुत से क्षेत्रों में हमारा collective knowledge बेहद sparse और जटिल है, इसलिए tools, models और ideas को चुनिंदा तरीके से high quality में recombine कर पाना बहुत शक्तिशाली है
सीमित search horizon (समय, संसाधन) में “अच्छे विकल्प” 1% हों या 3%, यह पूरी तरह अलग दुनिया बना देता है
सबसे महत्वपूर्ण बात यह है कि ऊपर की चर्चा intelligence के बारे में नहीं, बल्कि हमारे महत्वपूर्ण और मूल्यवान problems के लिए सूखे, व्यावहारिक solution farming के बारे में है। AGI और intelligence पर ज़्यादातर बहसें शायद इस सरल तथ्य को चूक जाती हैं। यह वैसा ही आम analogy है जैसे कहना कि विमान पक्षियों की तरह नहीं उड़ते या पनडुब्बियाँ तैरती नहीं हैं—जबकि इसका उपयोगिता से कोई लेना-देना नहीं
आखिर में, क्या आप सचमुच मानते हैं कि यह systems उन समस्याओं में, जिनका आम लोग जीवनभर सामना करते हैं, औसतन बेहतर नहीं हो सकते? जब science या medicine के आम problem exams में 60~70% अंक पाकर degree मिल जाती है, तो human intelligence को फिर कैसे परिभाषित किया जाना चाहिए?
- मैं बस संक्षेप में यह कहना चाहता हूँ कि विमानों में पक्षियों की तरह airfoil वाले पंख होते हैं, और पनडुब्बियों में मछलियों के swim bladder जैसी air tanks होती हैं
  ऐसे पक्षी भी हैं, जैसे albatross, जो लगभग बिना पंख फड़फड़ाए उड़ते हैं
deep learning का बड़ा हिस्सा मुझे compositional generalization लगता है। models reusable pieces सीखते हैं—यानी abstractions, styles, procedures, constraints वगैरह—और फिर उन्हें ऐसे तरीकों से recombine करते हैं जो training data में एक पूरे रूप में कभी दिखाई नहीं दिए
इसलिए भले ही सामग्री past data से आई हो, अंतिम संरचना एक महत्वपूर्ण अर्थ में नई हो सकती है
मैं उनकी बात ठीक से समझ नहीं पा रहा। क्या उनका मतलब a) यह है कि training stage में ही goals, यानी “preferences”, को सीधे integrate करने वाला कोई नया foundational algorithm चाहिए, या b) यह कि trained model को iterate करते समय goal की दिशा में रखना चाहिए?
अगर a), तो उन्होंने ऐसा कोई algorithm प्रस्तावित नहीं किया, और मुझे यह भी नहीं पता कि इतने low level पर abstract goals को quantify कैसे किया जाएगा। क्या उन्होंने ऐसा algorithm प्रस्तावित किया है और मैंने गलत पढ़ लिया? अगर b), तो वह पहले से मौजूद है। AlphaEvolve या उनके बताए गए कई examples ऐसे ही हैं, और थोड़ी शरारती तरह से कहें तो बस /goal डालकर चला देना है
साथ ही, यह कहना कि LLM अच्छे और नए काम नहीं कर सकते, मुझे category के स्तर पर गलत लगता है। अगर वे कर सकते हैं, तो कोई यह कह सकता है कि “वह नया नहीं, सिर्फ derivative है”, लेकिन मान लीजिए मैंने LLM से एक programming language बनाई और वह मेरे उद्देश्य के लिए अच्छी तरह काम करती है, तो क्या वह नई और अच्छी चीज़ नहीं है? क्या इसका मतलब यह है कि FORTRAN के अलावा बाकी सारी भाषाएँ नई नहीं हैं?
सब कुछ derivative है, और LLM ने जो चीज़ें try की हैं, उन्हें evaluate करने वाले loop के अंदर LLM को रखा जा सकता है। वह इतने गलत होने लायक सुस्त व्यक्ति नहीं लगते, इसलिए मुझे लगता है कि मैं कुछ गलत समझ रहा हूँ
- नहीं, मेरा ख़याल है कि वह कह रहे हैं कि हमारे पास पहले से ऐसी चीज़ें हैं और हमें उन्हें ज़्यादा इस्तेमाल करना चाहिए
  AlphaGo possible moves का evaluation करता है और iteration के समय discovery का उपयोग करता है
  Claude Code भी scripts generate करने के बाद, यह evaluate करते समय कि वे काम करती हैं या नहीं, discovery का उपयोग करता है
  उनका कहना है कि science और engineering में भी, जैसे code में किया जाता है, AI systems को खुद evaluation और iteration करने देना चाहिए
  मूल रूप से यह engineering के लिए harness engineering है
- LLM के पास नक्शा है, लेकिन वह उपजाऊ ज़मीन और बंजर ज़मीन में फर्क नहीं कर सकता। उदाहरण के लिए Anthropic का नया model किसी promising “drug” को कैसे generate करेगा? क्योंकि model में निहित knowledge के अलावा उसने AlphaFold के inference paradigm को आत्मसात किया है। सिर्फ Claude शायद protein analysis की method design नहीं कर पाएगा
- उनकी एक YouTube presentation में शायद उन्होंने कहा था कि हम ब्रह्मांड के “designer” युग में प्रवेश कर रहे हैं
  https://youtu.be/ThFq87Rp21s?si=SrKj72_X8bjnB6ED
  लगभग 35 मिनट पर
AI के लिए “creative” जैसे शब्द इस्तेमाल करते समय बहुत ठोस होना चाहिए
क्या AI कला बना सकता है? वह इंद्रियों को सुखद लगने वाली कोई चीज़ बना सकता है। लेकिन कला आखिरकार मानवीय भावनाओं और संवेदनाओं को संप्रेषित करने की चीज़ है। इंसानों के बीच भी कला की समझ सार्वभौमिक नहीं होती। “भावना और संवेदना”, इसलिए कला किसी खास समूह की साझा मान्यताओं और अनुभवों से गहराई से बंधी हो सकती है
क्या वह गणित या विज्ञान जैसे non-subjective क्षेत्रों में creative हो सकता है? Einstein ने creative thought experiments के ज़रिये general relativity निकाली थी। अगर AI प्रयोगों से सामने आई समस्या को हल करने के लिए कई mathematical frameworks को test करते-करते general relativity की field equations सामने ले आए, तो क्या वह creative होगा? शायद हो सकता है, लेकिन निश्चित रूप से उसी तरह नहीं
- डंडे और मिट्टी से लेकर काँच और हवा तक, किसी भी चीज़ से कला बनाई जा सकती है। इसलिए स्वाभाविक रूप से AI से भी कला बनाई जा सकती है
  अगर सवाल यह है कि क्या मशीन कला बना सकती है, तो आखिर किसी ने उस मशीन को चालू किया और उसे कला बनाने के लिए design किया, इसलिए सख्ती से देखें तो यह भी कहा जा सकता है कि वही व्यक्ति या लोग कला बना रहे हैं
  ऐतिहासिक रूप से “क्या x कला है?” इस सवाल का जवाब आखिरकार हमेशा “हाँ” ही बना है। लोग बार-बार उसी जाल में क्यों फँसते हैं, समझ नहीं आता
- उसकी creativity की परिभाषा closed loop है। यानी बना हुआ concept बगल से देख रहे observer के लिए नहीं, बल्कि system खुद के लिए नया होना चाहिए
- “कला आखिरकार मानवीय भावनाओं और संवेदनाओं को संप्रेषित करने की चीज़ है” इस कथन में एक छोटी-सी गलती है। कला रचयिता की भावनाएँ पहुँचाने से ज़्यादा, देखने वाले, सुनने वाले जैसे ग्रहणकर्ता में भावनाएँ जगाने के करीब है
  Wikipedia का कला वाला लेख इस तरह शुरू होता है
  “Art is a diverse range of cultural activity centered around works utilizing creative or imaginative talents, which are expected to evoke a worthwhile experience”
  https://en.wikipedia.org/wiki/Art
  इसलिए AI भी कला कर सकता है। क्योंकि उसे बस ग्रहणकर्ता में भावनात्मक प्रतिक्रिया पैदा करनी है
- मौजूदा models को image pastiche और style remix पर train किया गया है। लेकिन ऐसा कोई कारण नहीं है कि वे भावनात्मक और सांस्कृतिक संकेतकों को सीखें और pastiche व remix को संचालित करने वाली Artistic Director layer न जोड़ी जा सके
  असली समस्या यह है कि model की prompt-following क्षमता बहुत सीमित है। scene design में जिस स्तर का detail निर्दिष्ट किया जा सकता है, वह बहुत ही भद्दा है। इसलिए बहुत-से fill-in-the-blank pastiche details वाला “slop” effect तो आ सकता है, लेकिन ऐसे काम नहीं बन सकते जिनमें हर incidental object को message मज़बूत करने के लिए जानबूझकर रखा गया हो
  https://en.wikipedia.org/wiki/The_Awakening_Conscience
  मूल रूप से यह “मुझे साइकिल चलाते pelican की तस्वीर बनाकर दो” समस्या का expert version है
  कुछ परिस्थितियों में उस स्तर का creative control ज़रूरी होता है, और मौजूदा image generators उसके करीब भी नहीं पहुँचते
  और उस control के बिना, वे meta-creativity के उस स्तर तक नहीं पहुँच सकते जहाँ नई aesthetics बनाई जाती हैं जो सांस्कृतिक landmark बनती हैं, जैसा कि मशहूर कलाकार करते आए हैं और आज भी करते हैं
- आजकल लोग ऐसी कला को downvote कर देते हैं जो उन्हें असहज बनाती है
  उन्हें बस dopamine चाहिए। सोचना तकलीफ़ देता है, इसलिए वे सोचना नहीं चाहते
मुझे नहीं लगता कि machine learning creative नहीं हो सकती या discovery नहीं कर सकती। creativity और discovery आखिरकार ऊपर-ऊपर से अलग दिखने वाले सही concepts को एक साथ सोच पाने की बात है, जबकि algorithmic thinking अधिक स्पष्ट रूप से जुड़े concepts से निपटती है
LLM न भी हो, तब भी कोई model random ideas generate कर सकता है, उन्हें rank कर सकता है, और फिर सबसे अच्छा result output कर सकता है
बस मेरा मानना है कि ऐसे कामों में इंसान बेहतर हैं, और machine learning algorithmic thinking में बेहतर है। यहाँ “बेहतर” का मतलब है अधिक efficient होना और वह काम जिसे हम ज़्यादा पसंद से करते हैं, और खासकर इंसानों के लिए व्यक्तिपरक रूप से आकर्षक चीज़ों का, जिनमें हम खुद भी शामिल हैं, यानी taste का, अधिक सटीक आकलन कर पाना
मेरा मानना है कि machine learning को programming से अधिक generalization की ज़रूरत होती है, लेकिन फिर भी उसे ज़्यादातर logical tasks के लिए optimize किया जाना चाहिए। जैसे software development, translation, और कला व discovery के लिए tools
ठीक है। LLM अभी जैसे हैं, वैसे भी उपयोगी हैं। भले ही वे अगली पीढ़ी का गणित या भौतिकी कभी न दे सकें
इंसानों में भी stepwise leaps in thought पैदा करने वाले दिमाग इतने दुर्लभ हैं कि हम उन्हें नाम से याद रखते हैं
- हो सकता है कि आप यह चूक रहे हों कि वे दुर्लभ इंसान इतिहास में भुला दिए गए अधिक “साधारण” इंसानों की असंख्य विफलताओं या कुछ हद तक उपयोगी खोजों के ऊपर खड़े थे
वैकल्पिक लिंक: <https://xcancel.com/RichardSSutton/status/206121608774494665...>
अभी मेरी तरफ़ से 502 “Bad Gateway” आ रहा है, लेकिन लगता है कभी न कभी फिर ठीक हो जाएगा

Rich Sutton की AI रचनात्मकता और खोज

generative AI की सीमाएँ और उपयोगिता

नवीनता, randomness और evaluation की समस्या

विज्ञान और गणित के लिए ज़रूरी खोज

खोज के तीन चरण

evaluation, goals और autonomy

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News की राय