- Rust-आधारित संख्यात्मक गणना, मॉडल inference और training के लिए उच्च-प्रदर्शन Tensor लाइब्रेरी और deep learning framework
- static graph framework स्तर की optimization performance बनाए रखते हुए dynamic flexibility
- GPU/CPU backend का बहु-समर्थन
- GPU: CUDA, ROCm, Metal, Vulkan, WebGPU, LibTorch, Candle आदि
- CPU: CubeCL, NdArray, Candle, LibTorch आधारित
- Wasm और no_std environment में भी चल सकता है
- Backend trait को केंद्र में रखकर डिज़ाइन किया गया है, इसलिए विभिन्न hardware और runtime environment में बदले जा सकने वाले backend architecture उपलब्ध हैं
- Autodiff backend decorator: सभी backend में automatic differentiation क्षमता जोड़ता है
- Fusion backend decorator: kernel fusion क्षमता
- Router backend: CPU और GPU जैसे कई hardware के बीच computation distribution का समर्थन
- Remote backend: नेटवर्क के माध्यम से distributed computation और remote execution संभव
- training और inference की पूरी प्रक्रिया के लिए एकीकृत समर्थन
- Ratatui-आधारित terminal dashboard से real-time training monitoring
- embedded device से लेकर बड़े GPU cluster तक एक ही code से deploy किया जा सकता है
- PyTorch, Safetensors, ONNX मॉडल import करने की सुविधा से मौजूदा मॉडलों के पुन: उपयोग का समर्थन
- WebAssembly और WebGPU-आधारित browser inference
- no_std environment support के कारण operating system के बिना embedded device पर भी चल सकता है
- MIT/Apache 2.0 dual license के तहत वितरित
2 टिप्पणियां
PyTorch की तुलना में इसका प्रदर्शन कैसा है, यह जानने की जिज्ञासा है।
Rust, Wasm, WebGPU — ये नाम देखकर अच्छा लगा।