LLaMA-CPU - CPU पर LLaMA चलाने वाला fork

xguru · 2023-03-09T11:20:01+09:00

Meta के LLaMA मॉडल को CPU पर चलाता है सेटअप लगभग समान है 7B मॉडल पर टेस्ट करने पर, लोड करने के लिए 32GiB RAM में भी swap/zram की जरूरत पड़ती है वास्तविक inference के समय लगभग 20GiB से कम RAM का ही उपयोग होता है Ryzen 7900X पर 7B मॉडल प्रति सेकंड कुछ शब्दों का inference कर सकता है

(github.com/markasoftware)

4 पॉइंट द्वारा xguru 2023-03-09 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

Meta के LLaMA मॉडल को CPU पर चलाता है
सेटअप लगभग समान है
7B मॉडल पर टेस्ट करने पर, लोड करने के लिए 32GiB RAM में भी swap/zram की जरूरत पड़ती है
वास्तविक inference के समय लगभग 20GiB से कम RAM का ही उपयोग होता है
Ryzen 7900X पर 7B मॉडल प्रति सेकंड कुछ शब्दों का inference कर सकता है

LLaMA-CPU - CPU पर LLaMA चलाने वाला fork

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.