Leela Chess Zero की सीमाएँ
- Leela Chess Zero ने self-play के ज़रिए अरबों बार प्रशिक्षण लेकर विश्व चैंपियन का दर्जा हासिल किया
- लेकिन Stockfish के सामने पूरी तरह हार गया
- बड़ा नेटवर्क प्रशिक्षित करने पर भी वह Stockfish को हरा नहीं सका
- Stockfish ने Leela की तुलना में बहुत छोटा मॉडल इस्तेमाल किया, लेकिन बेहतर search क्षमता के कारण जीत हासिल की
Stockfish की जीत पर कुछ और विचार
- Leela search अच्छी तरह नहीं कर सका, इसलिए उसने विश्व चैंपियन की जगह गंवा दी
- LLM में search क्षमता जोड़ना अब काफी करीब है, लेकिन इस पर ध्यान नहीं दिया जा रहा
- GPT-4 जैसे Foundation models में search क्षमता नहीं है
- यह धारणा हावी है कि search संभव बनाने के लिए बड़े मॉडल चाहिए, लेकिन इसके प्रतिवाद मौजूद हैं
- DeepMind के शोध के अनुसार chess algorithm में search व्यवहार स्वाभाविक रूप से उभरता है
- जब efficient search algorithms मौजूद हैं, तब बड़े मॉडल में संयोग से inefficient precursor search के उभरने का इंतज़ार करने की ज़रूरत नहीं है
- आज के मॉडल search संभव बनाने के लिए पर्याप्त बड़े हैं, और शायद ज़रूरत से भी ज़्यादा बड़े हैं
Search लक्षित क्षेत्र में computing resources आवंटित करने में सक्षम बनाता है
- मान लें कि एक pharma company AI का उपयोग करके नई दवा पर शोध करना चाहती है
- AI search संभव होने वाली दुनिया में दो विकल्प हैं
- 2030 तक इंतज़ार किया जाए कि OpenAI 4 orders of magnitude बड़ा मॉडल जारी करे, या
- आज ही 4 orders of magnitude अधिक inference computing resources का उपयोग किया जाए
- pharma company दूसरे विकल्प को प्राथमिकता देगी
- search के माध्यम से 2030-स्तर की ASI क्षमता का उपयोग अभी से किया जा सकता है
Search-आधारित AI प्रगति परिदृश्य
- यह खोज लिया जाता है कि मौजूदा मॉडलों में search काम करता है
- सरकारें या बड़े research labs समझ जाते हैं कि AI research या विदेशी सूचना-संग्रह में search को तुरंत लागू किया जा सकता है
- inference computing resources सीमित होने के कारण इसका उपयोग सरकारों या बड़े research labs तक, और वह भी security या AI research तक सीमित रहता है
- search-प्रेरित AI प्रगति से अधिक efficient search algorithms और model architectures खोजे जाते हैं
- search को अधिक training data की ज़रूरत नहीं होती, इसलिए 'data wall' की समस्या हल हो जाती है
- intelligence explosion 2030 में नहीं, बल्कि अगले ही साल से शुरू हो जाता है
स्वयं AI research में search लागू करने की संभावना
- यदि AI इतना आगे बढ़ जाए कि वह स्वयं पर research कर सके, तो तेज़ प्रगति की dynamics की उम्मीद की जा सकती है
- जैसे pharma companies नई दवा के शोध के लिए GPT-8 का इंतज़ार किए बिना आगे बढ़ सकती हैं, वैसे ही AI labs भी बड़े मॉडल का इंतज़ार किए बिना AI पर research कर सकेंगी
- मानव AI researchers को replace करने के लिए शायद और अधिक constraints हटाने की ज़रूरत पड़े
- लेकिन GPT-8 स्तर की बुद्धिमत्ता वाला एक साधारण chatbot भी AI प्रगति को तेज़ करने के लिए पर्याप्त हो सकता है
1 टिप्पणियां
Hacker News राय
Hacker News टिप्पणियों का सारांश