1 पॉइंट द्वारा GN⁺ 2025-03-12 | 1 टिप्पणियां | WhatsApp पर शेयर करें

प्रायिकतात्मक कृत्रिम बुद्धिमत्ता

  • कृत्रिम बुद्धिमत्ता उस विज्ञान और अभियांत्रिकी को दर्शाती है जो ऐसे कृत्रिम सिस्टम बनाती है जो मानव बुद्धिमत्ता की मांग वाले कार्य कर सकें। हाल के वर्षों में learning-आधारित data-centric approach में रोचक प्रगति हुई है, और machine learning तथा deep learning ने computer systems के लिए दुनिया को समझने के नए तरीके संभव बनाए हैं। reinforcement learning ने Go जैसे जटिल खेलों और robotics tasks में महत्वपूर्ण breakthroughs दिए हैं.

  • बुद्धिमत्ता का एक मुख्य पहलू केवल prediction करना नहीं, बल्कि इन predictions की uncertainty को समझना और निर्णय लेते समय इस uncertainty को ध्यान में रखना भी है। यह शोधपत्र "प्रायिकतात्मक कृत्रिम बुद्धिमत्ता" पर केंद्रित है।

प्रायिकतात्मक दृष्टिकोण

  • पहले भाग में machine learning के प्रति प्रायिकतात्मक दृष्टिकोण पर चर्चा की गई है। इसमें data की कमी से उत्पन्न "epistemic" uncertainty और, उदाहरण के लिए, noisy observations तथा outcomes से उत्पन्न "aleatoric" uncertainty के बीच के अंतर पर चर्चा की गई है। प्रायिकतात्मक inference के ठोस approaches और efficient approximate inference के आधुनिक approaches पर भी चर्चा की गई है।

क्रमिक निर्णय कार्यों में uncertainty पर विचार

  • दूसरे भाग में क्रमिक निर्णय कार्यों में uncertainty को ध्यान में रखने पर चर्चा की गई है। इसमें active learning और Bayesian optimization को शामिल किया गया है, जो ऐसे approaches हैं जिनमें epistemic uncertainty को कम करने के लिए informative experiments सुझाकर data एकत्र किया जाता है। reinforcement learning और neural network function approximation का उपयोग करने वाले आधुनिक deep RL approaches पर विचार किया गया है। model-based RL के आधुनिक approaches पर चर्चा की गई है, जो exploration को guide करने के लिए epistemic और aleatoric uncertainty का उपयोग करते हैं और safety पर भी विचार करते हैं।

1 टिप्पणियां

 
GN⁺ 2025-03-12
Hacker News राय
  • टेक्स्ट में बेहतरीन explanatory diagrams हैं, और यह probability के नज़रिए से machine learning का high-quality overview लगता है

    • हाल ही में Zhao की मुफ़्त textbook और YouTube lectures, "Mathematical Foundation of Reinforcement Learning", ने मुझे काफ़ी प्रभावित किया
    • अगर आपके पास ज़्यादा समय नहीं है, तो Zhao के overview content diagrams को एक बार देख लेना अच्छा रहेगा। यह पूरे field का एक अच्छा conceptual map है
    • और introductory video देखने की भी सिफारिश है
  • मैंने कुछ दिन पहले यह material खोजा, और Andreas Krause ने Gaussian Processes और Bandits पर गहरा और दिलचस्प research किया है, इसलिए इसे गंभीरता से देखने का एक बहाना मिल गया

  • अस्तित्वगत वास्तविकता states का array नहीं, बल्कि potentials का distribution है

    • potential अस्तित्व में है, और probability उसके distribution का mathematical description है। सभी properties dimensions (vectors) हैं
    • state सिर्फ resolution का एक क्षणिक measurement है। potentials constructive और destructive interference के ज़रिए interact करते हैं
    • constructive और destructive interference क्षणिक measurement के "अभी" वाले state में resolve होते हैं
  • सवाल यह है कि क्या LLM (यानी neural network) अभी-अभी दिए गए अपने जवाब की probability बता सकता है

    • बहुत पहले university में मैंने ऐसी चीज़ें पढ़ी थीं, और हर term के लिए probability और confidence coefficient के साथ एक Prolog interpreter बनाया था
  • मुझे लगता है कि model interpretability को लोकतांत्रिक बनाने और gamers को भी इसे explore करने देने के लिए एक GUI चाहिए

    • मूल रूप से, यह एक और model को train करना होगा जो LLM को 3D रूप में बदलकर उसे इंसानों के समझने लायक 3D दुनिया में रखे
    • एक सरल उदाहरण के तौर पर, LLM को हरे मैदान और objects के रूप में दिखाया जाए, और इंसान को एकमात्र agent के रूप में सेट किया जाए
  • मुझे लगता है कि सही kernel वाले Gaussian Processes कुछ data points और parameter के छोटे set के साथ भी बहुत शक्तिशाली होते हैं

    • मैंने उन्हें computer vision task में input को adjust करने वाली predictable nonlinear process के रूप में इस्तेमाल किया है, और नतीजे बहुत अच्छे थे
  • यह इस विषय पर उपलब्ध सबसे अच्छे references में से एक और आंशिक रूप से overlapping सामग्री जैसा लगता है। Gareth James आदि की "An Introduction to Statistical Learning" का उल्लेख किया गया है

    • सोच रहा हूँ कि क्या यह material ज़्यादा accessible होगा; R/Python examples मददगार होंगे
  • Kevin Murphy अपनी Probabilistic Machine Learning series का नाम बदल रहे हैं

  • Gemini 2.0 Experimental 02-05 ने इसे "सिर्फ" 107K tokens में पढ़ लिया

    • अगर आपको इसे तोड़कर समझने में मदद चाहिए, तो यह उपयोगी है
  • Laplace Approximation जटिल probability distributions को एक सरल Gaussian (bell curve) में बदलने का एक "तेज़ और आसान" तरीका है

    • यह peak को खोजकर और उसी बिंदु पर curvature को match करके काम करता है
    • यह तेज़ और आसान है, लेकिन अगर वास्तविक distribution bell curve जैसा न हो तो यह बहुत inaccurate और overconfident हो सकता है
  • मैंने ETH Zurich में यह class ली थी, और यह मेरी पसंदीदा classes में से एक थी

    • खास तौर पर uncertainty को quantify करने के तरीके और reinforcement learning के शुरुआती building blocks बनाने का तरीका प्रभावशाली है
    • यह data scientists और ML engineers के लिए बेहतरीन पढ़ाई है। यह document lecture notes है