-
शोध का अवलोकन
- LIMO मॉडल एक नई समझ प्रस्तुत करता है कि बड़े language models में जटिल reasoning क्षमता कैसे उभरती है।
- मौजूदा धारणा के विपरीत, जटिल गणितीय reasoning को कम संख्या के उदाहरणों से भी प्रभावी रूप से प्रेरित किया जा सकता है।
- LIMO ने केवल 817 training samples के साथ AIME में 57.1% और MATH में 94.8% accuracy हासिल की।
- यह पहले के SFT-आधारित models के 6.5% और 59.2% की तुलना में बहुत बड़ा सुधार है, जबकि इसमें पिछले approaches के training data का सिर्फ 1% इस्तेमाल किया गया।
-
LIMO का प्रदर्शन
- LIMO ने 10 अलग-अलग benchmarks पर 40.5% का absolute performance improvement दिखाया और 100 गुना अधिक data पर train किए गए models को पीछे छोड़ा।
- यह उस पारंपरिक धारणा को चुनौती देता है कि SFT, memorization के बजाय generalization की ओर ले जाता है।
-
LIMO परिकल्पना
- LIMO परिकल्पना यह सुझाव देती है कि यदि foundation model में domain knowledge pre-training के दौरान पूरी तरह encode हो चुका हो, तो बहुत कम demonstrations से भी जटिल reasoning क्षमता उभर सकती है।
- जटिल reasoning को प्रेरित करने की threshold दो मुख्य कारकों से तय होती है:
- pre-training के दौरान model के encoded knowledge base की पूर्णता।
- post-training examples की प्रभावशीलता, जो एक "cognitive template" के रूप में दिखाती है कि model जटिल reasoning tasks को हल करने के लिए knowledge base का उपयोग कैसे करे।
-
Open source उपलब्धता
- data-efficient reasoning पर पुनरुत्पादकता और भविष्य के शोध को बढ़ावा देने के लिए LIMO को एक comprehensive open source suite के रूप में उपलब्ध कराया गया है।
अभी कोई टिप्पणी नहीं है.