1 पॉइंट द्वारा GN⁺ 2025-03-06 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • ACM A.M. Turing Award Honors Two Researchers Who Led the Development of Cornerstone AI Technology

  • Andrew Barto and Richard Sutton Recognized as Pioneers of Reinforcement Learning

    • ACM ने Andrew G. Barto और Richard S. Sutton को 2024 ACM A.M. Turing Award के विजेताओं के रूप में चुना है। इन दोनों ने reinforcement learning की वैचारिक और algorithmic नींव विकसित की।
    • Barto, University of Massachusetts Amherst में information and computer science के professor emeritus हैं, और Sutton, University of Alberta में computer science के professor हैं।
    • Turing Award को computing क्षेत्र का Nobel Prize कहा जाता है, और Google के वित्तीय समर्थन से इसके साथ 10 लाख डॉलर की पुरस्कार राशि दी जाती है।
  • What is Reinforcement Learning?

    • artificial intelligence (AI) का क्षेत्र मुख्य रूप से ऐसे agents बनाने पर केंद्रित है जो perceive करें और act करें। reinforcement learning (RL) वह प्रक्रिया है जिसमें ऐसे agents reward signal के माध्यम से बेहतर actions सीखते हैं।
    • reinforcement learning की नींव 1980 के शुरुआती दशक में शुरू हुई, जब Barto और Sutton ने psychology में किए गए अवलोकनों के आधार पर reinforcement learning को एक सामान्य problem framework के रूप में औपचारिक रूप दिया।
    • इन दोनों ने Markov decision process (MDP) पर आधारित mathematical foundation का उपयोग कर reinforcement learning algorithms विकसित किए।
  • प्रमुख योगदान

    • Barto और Sutton ने reinforcement learning के बुनियादी algorithmic approaches विकसित किए, जिनमें विशेष रूप से temporal-difference learning, policy gradient methods, और neural networks का उपयोग करने वाले learned function representations शामिल हैं।
    • इनकी पाठ्यपुस्तक "Reinforcement Learning: An Introduction" आज भी इस क्षेत्र की मानक reference book मानी जाती है, और इसे 75,000 से अधिक बार उद्धृत किया जा चुका है।
  • reinforcement learning के वास्तविक अनुप्रयोग

    • reinforcement learning ने पिछले 15 वर्षों में deep learning algorithms के साथ मिलकर बड़ी प्रगति की है। इसके प्रमुख उदाहरणों में AlphaGo की Go में जीत और ChatGPT का विकास शामिल हैं।
    • reinforcement learning ने robot motor skill learning, network congestion control, chip design, और internet advertising optimization जैसे विभिन्न क्षेत्रों में सफलता हासिल की है।
  • reinforcement learning की neuroscience से प्रेरणा

    • हालिया शोध के अनुसार, AI में विकसित कुछ reinforcement learning algorithms मानव मस्तिष्क के dopamine system को समझाने के लिए सबसे उपयुक्त पाए गए हैं।
  • ACM A.M. Turing Award के बारे में

    • Turing Award 1966 से उन computer scientists और engineers को सम्मानित करने के लिए दिया जा रहा है जिन्होंने information technology industry को आगे बढ़ाया है।
  • 2024 ACM A.M. Turing Award विजेता

    • Andrew Barto, University of Massachusetts Amherst में information and computer science के professor emeritus हैं और उन्होंने कई पुरस्कार जीते हैं।
    • Richard Sutton, University of Alberta में computer science के professor हैं, विभिन्न research institutions में सक्रिय रहे हैं, और उन्होंने भी कई पुरस्कार प्राप्त किए हैं।

1 टिप्पणियां

 
GN⁺ 2025-03-06
Hacker News की राय
  • यह बहुत शानदार है। मेरी पत्नी और मैंने Andy Barto और उनकी पत्नी का घर खरीदा था

    • खरीद प्रक्रिया के दौरान bidding war हुई थी
    • मुझे पता था कि वे गणितज्ञ हैं, इसलिए मैंने prime number में offer दिया
    • उनकी उपलब्धियों को मान्यता मिलते देख सच में बहुत खुशी हुई
  • शानदार! वे पूरी तरह इसके हकदार हैं। वे RL पाठ्यपुस्तक के दोनों editions मुफ्त PDF में देते हैं

    • मैं 1982 से AI practitioner के रूप में काम कर रहा हूँ, और RL व्यक्तिगत रूप से मेरे लिए master करना कठिन विषय था
    • Sutton/Barto की किताब, Professor White का Coursera RL course आदि बहुत मददगार रहे: recommend करता हूँ
    • उनकी किताब के example programs Common Lisp और Python में उपलब्ध हैं
  • The Bitter Lesson को फिर से पढ़ने का अच्छा समय है

  • Sutton मानव उत्तराधिकारवादी हैं, और उन्हें इस बात से फर्क नहीं पड़ता कि सभी इंसान मर जाएँ। उन पर भरोसा नहीं किया जा सकता और वे बधाई के पात्र नहीं हैं

  • काश यह पुरस्कार physicists को दिया गया होता

  • यह हैरान करने वाला है कि Sutton अमेरिका के बजाय कनाडा के Edmonton में रहते हैं

    • यह दिखाता है कि वे शोहरत और पैसे से ज्यादा ईमानदारी और गंभीरता को महत्व देते हैं
  • ये दोनों महान हैं, लेकिन दुर्भाग्य से Sutton और Barto की AI किताब सचमुच बहुत खराब है

    • Trask की Grokking Machine Learning और कुछ महीनों तक ML papers के implementations करना इससे बेहतर होगा
  • मैंने अपने पढ़ाए गए course में उनकी RL किताब का इस्तेमाल किया था

    • यह खूबसूरती से लिखी गई है और मुफ्त में उपलब्ध है
    • मैं अक्सर उसकी सुंदर लिखावट पर इतना ध्यान देता था कि असली सामग्री ही छूट जाती थी
  • Andrew Barto और Richard Sutton को Turing Award मिलने पर हार्दिक बधाई

    • छात्र जीवन में, उनकी पाठ्यपुस्तक Reinforcement Learning: An Introduction ही इस क्षेत्र में मेरे प्रवेश का कारण बनी थी
    • 'Temporal Difference Learning' पर Chapter 6 ने sequential decision-making के बारे में मेरी सोच को मूल रूप से बदल दिया था
    • यह आज भी एक ऐसा classic है जिसे पढ़ने की मैं जोरदार सिफारिश करता हूँ
  • यह बहुत पहले हो जाना चाहिए था। उन्होंने शुरू से अंत तक इस विचार को आगे बढ़ाया और इसे dynamic programming की किताब के एक उप-अध्याय के बजाय पूरे एक क्षेत्र में बदल दिया

    • काश और ज़्यादा games वास्तव में RL का उपयोग करते — आखिर यहीं से यह सब शुरू हुआ था — यह सचमुच शानदार होता