- HN पर open source LLM के fine-tuning में रुचि काफी बढ़ रही है (उदाहरण: Anyscale की पोस्ट)
- मॉडल fine-tuning पर कई वर्षों का अनुभव, insights, और practical code साझा किया गया
- data labeling, fine-tuning, efficient inference चलाने, और cost/performance evaluation को कवर करने वाले notebooks का set उपलब्ध
- test set पर GPT-4 के labels से 95% मेल खाने वाला 7B मॉडल train किया गया
- fine-tuning क्या है? यह टेक्स्ट में instructions लिखने की तुलना में prompting का अधिक शक्तिशाली रूप है
- fine-tuned मॉडल की training के लिए existing मॉडल को example input/output pairs पर train किया जाता है
- prompting और fine-tuning के फायदे और नुकसान
- fine-tuning का बड़ा फायदा: यह मॉडल के behavior को निर्देशित करने में कहीं अधिक प्रभावी है, इसलिए बहुत छोटे मॉडल से भी काम चल सकता है
- fine-tuned Llama 7B मॉडल, GPT-3.5 की तुलना में प्रति token 50 गुना सस्ता है, और कई use cases में समान या बेहतर परिणाम देता है
- उदाहरण: GPT-4 के साथ 2M recipes का classification करने में $23k खर्च होता है, लेकिन हमारे fine-tuned मॉडल ने GPT-4 जैसी performance दिखाते हुए पूरे dataset को चलाने में सिर्फ $19 खर्च किए
- OpenPipe नाम का एक open source product विकसित किया जा रहा है
- OpenPipe product का उद्देश्य engineers को fine-tuning अपनाने में यथासंभव सरलता से मदद करना है
- यह पोस्ट fine-tuning के बारे में सीखी गई बातों को साझा करने के लिए है
1 टिप्पणियां
Hacker News राय