- WebGPU सपोर्ट (WASM से 100 गुना तक तेज़)
- नए quantization formats dtypes
- 120 architectures का सपोर्ट
- 25 नए example projects और templates
- 1200 से अधिक pre-converted models
- Node.js (ESM + CJS), Deno और Bun compatibility
WebGPU सपोर्ट
- WebGPU accelerated graphics और computing के लिए एक नया web standard है
- यह developers को browser में सीधे system के GPU का उपयोग करके high-performance computation करने देता है
- WebGL के successor के रूप में यह modern GPU के साथ अधिक direct interaction संभव बनाता है, जिससे performance में बड़ा सुधार होता है
- साथ ही यह general-purpose GPU computation को सपोर्ट करता है, इसलिए machine learning के लिए उपयुक्त है
- अक्टूबर 2024 तक, दुनिया भर में WebGPU support rate लगभग 70% है
- browser के अनुसार WebGPU को सक्षम करने के लिए feature flags का उपयोग करना पड़ सकता है
- Transformers.js v3 में WebGPU का उपयोग
- ONNX Runtime Web के साथ सहयोग की बदौलत, model load करते समय सिर्फ
device: 'webgpu' सेट करके WebGPU acceleration सक्षम की जा सकती है
- text embedding computation, speech recognition, image classification आदि में WebGPU का उपयोग किया जा सकता है
नए quantization formats (dtypes)
- Transformers.js v3 से पहले,
quantized option के ज़रिए quantized (q8) या full-precision (fp32) model variants चुने जा सकते थे
- अब
dtype parameter के साथ कहीं अधिक बड़े विकल्पों की सूची में से चुना जा सकता है
- उपलब्ध quantization सूची model के अनुसार अलग होती है, लेकिन आम तौर पर full-precision ("fp32"), half-precision ("fp16"), 8-bit ("q8", "int8", "uint8"), 4-bit ("q4", "bnb4", "q4f16") आदि शामिल हैं
- module-specific dtypes
- Whisper या Florence-2 जैसे कुछ encoder-decoder models, खासकर encoder की quantization settings के प्रति बहुत sensitive होते हैं
- इसी वजह से module name से dtype तक mapping देकर module-specific dtypes चुनने की सुविधा जोड़ी गई है
120 supported architectures
- इस release में supported architectures की कुल संख्या बढ़कर 120 हो गई है, जो विभिन्न input formats और tasks को कवर करती है
- उल्लेखनीय नए architectures में Phi-3, Gemma & Gemma 2, LLaVa, Moondream, Florence-2, MusicGen, Sapiens, Depth Pro, PyAnnote, RT-DETR आदि शामिल हैं
25 example projects और templates
- इस release के हिस्से के रूप में WebGPU support को प्रमुखता से दिखाने वाले 25 नए example projects और templates जारी किए गए हैं
- इसमें Phi-3.5 WebGPU, Whisper WebGPU आदि के demos शामिल हैं
1200 से अधिक pre-converted models
- release के समय तक, community ने 1200 से अधिक models को Transformers.js के साथ compatible बनाने के लिए convert किया है
- अपने model या fine-tuning को convert करने के लिए दिए गए conversion scripts का उपयोग किया जा सकता है
- बने हुए files को Hugging Face Hub पर upload करने के बाद
transformers.js tag जोड़ दें, ताकि दूसरे लोग उन्हें आसानी से खोज और उपयोग कर सकें
Node.js (ESM + CJS), Deno और Bun compatibility
- Transformers.js v3 अब तीन सबसे लोकप्रिय server-side JavaScript runtimes के साथ compatible है
- Node.js: Chrome के V8 पर बना व्यापक रूप से उपयोग किया जाने वाला JavaScript runtime, जिसमें libraries और frameworks का व्यापक support है
- Deno: JavaScript और TypeScript के लिए एक modern runtime, जो by default बेहतर security देता है, ES modules का उपयोग करता है, और experimental WebGPU support भी प्रदान करता है
- Bun: performance के लिए optimized तेज़ JavaScript runtime, जिसमें built-in bundler, transpiler और package manager शामिल हैं
NPM और GitHub पर नया home
- Transformers.js अब NPM पर आधिकारिक Hugging Face organization में
@huggingface/transformers के रूप में publish किया जाएगा (@xenova/transformers की जगह, जो v1 और v2 में उपयोग हुआ था)
- repository को GitHub की आधिकारिक Hugging Face organization (https://github.com/huggingface/transformers.js) में स्थानांतरित कर दिया गया है, और यही इसका नया home होगा
1 टिप्पणियां
Transformers.js - ब्राउज़र में Transformers चलाना
Transformers.js जो सीधे ब्राउज़र में चल सकता है