Quiet-STaR: क्या language models को बोलने से पहले सोचना सिखाया जा सकता है
- लोग लिखते या बोलते समय कभी-कभी सोचने के लिए रुकते हैं, और इस तरह का reasoning लगभग हर लिखित टेक्स्ट में निहित होता है.
- Self-Taught Reasoner(STaR) में, प्रश्न-उत्तर में कुछ उदाहरणों के जरिए rationale का अनुमान लगाकर, और सही उत्तर तक ले जाने वाले rationale से सीखकर उपयोगी सोच सीखने का तरीका प्रस्तुत किया गया है.
- Quiet-STaR, STaR का एक generalization है, जो language model को भविष्य के टेक्स्ट को समझाने के लिए हर token पर rationale generate करना सिखाकर prediction को बेहतर बनाता है.
प्रमुख चुनौतियाँ और समाधान
- लगातार टेक्स्ट generation की computational cost, language model का शुरू में internal thoughts को generate या use करना न जानना, और केवल अगले एक token से आगे की prediction की आवश्यकता जैसी चुनौतियाँ मौजूद हैं.
- इन समस्याओं को हल करने के लिए, thought की शुरुआत और अंत को दिखाने वाले learnable tokens का उपयोग करने वाला token-wise parallel sampling algorithm और extended teacher-forcing technique प्रस्तावित की गई है.
मॉडल प्रदर्शन में सुधार
- generated rationale कठिन tokens की prediction में मदद करते हैं और language model की कठिन सवालों का सीधे जवाब देने की क्षमता को बेहतर बनाते हैं.
- इंटरनेट टेक्स्ट corpus पर Quiet-STaR के साथ language model को आगे pretrain करने के परिणामस्वरूप, GSM8K(5.9%→10.9%) और CommonsenseQA(36.3%→47.2%) में zero-shot सुधार मिला, और प्राकृतिक टेक्स्ट में कठिन tokens की perplexity में सुधार देखा गया.
- ये सुधार संबंधित tasks के लिए fine-tuning के बिना हासिल किए गए.
GN⁺ की राय
- Quiet-STaR यह दिखाता है कि language models अधिक सामान्य और scalable तरीके से reasoning सीखने की दिशा में एक कदम आगे बढ़े हैं.
- यह शोध AI क्षेत्र में language understanding और reasoning क्षमता को मजबूत करने वाली एक महत्वपूर्ण प्रगति को दर्शाता है, और natural language processing तकनीकों के विकास में योगदान दे सकता है.
- आलोचनात्मक दृष्टि से देखें तो, जब ऐसी तकनीकें वास्तविक दुनिया की जटिल समस्याओं पर लागू होंगी, तब वे अप्रत्याशित परिणाम ला सकती हैं; इसलिए अतिरिक्त शोध और safety measures की आवश्यकता है.
- इसी तरह की क्षमता देने वाले अन्य प्रोजेक्ट्स में OpenAI की GPT series और Google का BERT शामिल हैं, और इनमें भी language understanding और generation क्षमता सुधारने पर शोध जारी है.
- तकनीक अपनाते समय training data की quality और diversity, model का ethical use, और computational cost जैसे पहलुओं पर विचार करना चाहिए; वहीं इस तकनीक का लाभ अधिक सटीक और सूक्ष्म language models का निर्माण है.
1 टिप्पणियां
Hacker News की राय