IPEX-LLM - Intel CPU/GPU पर LLM चलाने के लिए PyTorch लाइब्रेरी
(github.com/intel-analytics)- Intel Extension for PyTorch (IPEX) पर आधारित
- 50 से अधिक मॉडलों के लिए optimized/verified (LLaMA2, Mistral, Gemma, LLaVa, Whisper आदि)
- लोकल iGPU या Arc/Flex/Max जैसे distributed GPU पर low latency के साथ चलाया जा सकता है
- llama.cpp, HuggingFace, LangChain, LlamaIndex आदि के साथ अच्छा integration
अभी कोई टिप्पणी नहीं है.