- Microsoft के Orca पेपर की सामग्री लेकर उसे ओपन सोर्स के रूप में replicate करके बनाया गया है
- GPT-4 Completion से संवर्धित लगभग 10 लाख FLANv2
- GPT-3.4 Completion से संवर्धित लगभग 35 लाख FLANv2
- FLAN-1m डेटासेट में मौजूद 75k CoT पूरे के पूरे शामिल
- फिलहाल LLaMA-13B foundation पर full weights के लिए fine-tuning चल रही है, इसलिए इसका प्रदर्शन Microsoft वाले के समान हो जाएगा
- जुलाई के मध्य तक OpenOrca-LLaMA-13b रिलीज़ किया जा सकता है
- OpenOrca को दूसरे platforms (Falcon, LLaMA, MPT आदि) पर लागू करने के लिए GPU computing sponsor की तलाश में
2 टिप्पणियां
अरे, लिंक 404 है।
डेटासेट आप HuggingFace के Open-Orca/OpenOrca पर देख सकते हैं! :D
अरे, लगता है पोस्ट हटा दी गई है।
WaybackMachine में यह अभी भी मौजूद है.
https://web.archive.org/web/20230629002546/…
लिंक को आपने जो HuggingFace लिंक दिया था, उससे अपडेट कर दिया है।