Magic: The Gathering ड्राफ्ट में Mistral 7B का फाइन-ट्यूनिंग
(generallyintelligent.substack.com)सारांश: AI की फाइन-ट्यूनिंग तकनीक की पड़ताल
- फाइन-ट्यूनिंग तकनीक की प्रभावशीलता और कठिनाई
- फाइन-ट्यूनिंग GPT-4 की क्षमताओं को पूरक बनाती है और गति व लागत दक्षता का वादा करती है।
- फाइन-ट्यूनिंग वास्तव में कितनी प्रभावी और कठिन है, इस पर जानकारी की कमी को दूर करने के लिए सीधे प्रयोग किया गया।
समस्या का चयन
- Magic: The Gathering (MTG) ड्राफ्ट के ज़रिए मॉडल की reasoning क्षमता का परीक्षण
- MTG एक रणनीतिक कार्ड गेम है, और ड्राफ्ट वह तरीका है जिसमें यादृच्छिक कार्ड पूल से कार्ड चुनकर डेक बनाया जाता है।
- ड्राफ्ट reasoning और नए डेटा की समझ की मांग करने वाला जटिल कार्य है, इसलिए यह उपयुक्त है।
- 17lands नामक सेवा द्वारा दिए गए बड़े ऐतिहासिक डेटा का उपयोग कर शीर्ष खिलाड़ियों के ड्राफ्ट चयन को "ground truth" के रूप में इस्तेमाल किया गया।
परिणाम और सार
- फाइन-ट्यून किए गए 7B मॉडल का प्रदर्शन
- फाइन-ट्यून किया गया 7B मॉडल GPT-4 से आगे निकल गया और मानव-स्तर के करीब प्रदर्शन दिखाया।
- GPT-3.5 को फाइन-ट्यून करने पर संभव है कि बेहतर परिणाम मिलें, लेकिन इसकी लागत बहुत अधिक है।
- फाइन-ट्यूनिंग अभी भी एक प्रयोगधर्मी प्रक्रिया है, खासकर prompt engineering में बहुत समय लगता है।
- नए कार्ड सेट पर फाइन-ट्यूनिंग के बाद, इसने अनदेखे कार्ड सेटों पर भी generalization क्षमता दिखाई।
फील्ड रिपोर्ट: विधि और सीखने की प्रक्रिया
- डेटा निर्माण
- 17lands के CSV फ़ाइल फ़ॉर्मेट वाले डेटा को टेक्स्ट फ़ॉर्मेट में बदला गया ताकि वह फाइन-ट्यूनिंग के लिए उपयुक्त हो सके।
- डेटा formatting एक चुनौतीपूर्ण और प्रयोगधर्मी प्रक्रिया थी।
- फाइन-ट्यूनिंग चलाना
- GPU उपलब्धता की समस्या के कारण Runpod से प्रति घंटे के हिसाब से GPU किराए पर लिया गया।
- axolotl का उपयोग करके फाइन-ट्यूनिंग optimization को आसानी से लागू किया गया।
- मूल्यांकन
- प्रयोग शुरू करने से पहले मूल्यांकन मानदंड तय करना महत्वपूर्ण है।
- language model के लिए मूल्यांकन मानदंड तय करना कठिन हो सकता है।
मुख्य सीख
- फाइन-ट्यूनिंग की प्रभावशीलता
- नए डेटा पर फाइन-ट्यूनिंग सटीकता और लागत, दोनों में GPT-4 से बेहतर है।
- फाइन-ट्यूनिंग को सही तरीके से करने के लिए प्रयोगधर्मी प्रक्रिया की आवश्यकता होती है, और यह prompt engineering की तुलना में सीखने में अधिक कठिन विशेष कौशल है।
Magic से जुड़ी अतिरिक्त जानकारी
- फाइन-ट्यून किए गए AI ड्राफ्ट बॉट का प्रदर्शन
- Magic Arena logs से जुड़े ड्राफ्ट मॉडल का उपयोग कर एक ड्राफ्ट सहायक ऐप विकसित किया गया।
- फाइन-ट्यून किया गया मॉडल चयन उत्पन्न करता है, जबकि GPT-4 व्याख्या प्रदान करता है।
- कई AI ड्राफ्ट बॉट का simulation करके मानव ड्राफ्टर जैसे प्रदर्शन का प्रदर्शन किया गया।
GN⁺ की राय
इस लेख का सबसे महत्वपूर्ण बिंदु यह है कि फाइन-ट्यूनिंग तकनीक में मौजूदा बड़े language models (जैसे GPT-4) के प्रदर्शन से आगे निकलने की क्षमता है, और इसके ज़रिए विशिष्ट कार्यों के लिए AI की समझ और दक्षता को काफी बढ़ाया जा सकता है। यह लेख इसलिए रोचक है क्योंकि यह वास्तविक अनुप्रयोग के ज़रिए फाइन-ट्यूनिंग की ठोस प्रक्रिया और उसके प्रभाव को दिखाता है, जिससे शुरुआती software engineers को भी AI तकनीक की प्रगति की संभावनाओं और उसके उपयोग के तरीकों को समझने में मदद मिल सकती है।
1 टिप्पणियां
Hacker News राय