Google Web AI Summit 2024 सारांश: डेवलपर्स के लिए क्लाइंट-साइड AI
(developers.googleblog.com)- 18 अक्टूबर 2024 को Google ने अपना पहला Web AI Summit आयोजित किया
- क्लाइंट-साइड पर ब्राउज़र के भीतर machine learning models का उपयोग करके ऑफलाइन में भी low-latency inference, लागत में कमी और privacy protection जैसी क्षमताएं प्रदान की जाती हैं
प्रमुख घोषणा सत्रों का सारांश
-
Transformers.js: वेब के लिए आधुनिक machine learning
- Transformers.js, Hugging Face की Python Transformers library के फ़ंक्शनल रूप से समान एक JavaScript library है, जिसे सीधे वेब पर उपयोग किया जा सकता है
- यह 1,000 से अधिक pre-trained models को सपोर्ट करती है और text, image, speech जैसी विभिन्न tasks और modalities को कवर करती है
- उपयोगकर्ता pre-trained model चुन सकते हैं, या custom model को सीधे ब्राउज़र में चला सकते हैं
- WebGPU support के साथ आधुनिक GPU capabilities का उपयोग कर तेज़ और कुशल model execution संभव है
-
Web Neural Network (WebNN) API: वर्तमान और भविष्य
- WebNN API वेब standard के रूप में प्रस्तावित एक नया API है, जो क्लाइंट-साइड पर machine learning workloads को तेज़ और कुशल ढंग से चलाने के लिए बनाया गया है
- WebAssembly और WebGPU का उपयोग करके ब्राउज़र के भीतर AI acceleration प्रदान करता है
- विभिन्न devices पर AI workloads चलाने के लिए CPU, GPU और NPU जैसे hardware accelerators को सपोर्ट करता है
- इसमें API के नवीनतम developments, device support, framework compatibility और browser implementations पर चर्चा की गई
-
Intel की Web AI PC तकनीक
- Intel, WebNN API का उपयोग करके क्लाइंट-साइड web ML acceleration प्रदान करता है, जिससे CPU, GPU और NPU पर high-performance execution संभव होता है
- यह अभी Chrome और Edge browsers में developer preview version के रूप में उपलब्ध है
- यह ONNX Runtime Web के साथ integrated है, इसलिए विभिन्न machine learning frameworks में उपयोग किया जा सकता है
- demos और शुरुआती user feedback के आधार पर यह “native के क़रीब” performance देता है और नए web experiences की संभावनाएं दिखाता है
-
ml5.js: वेब-फ्रेंडली machine learning
- ml5.js, TensorFlow.js पर आधारित एक open source library है, जिसे machine learning को अधिक सुलभ बनाने के लिए डिज़ाइन किया गया है
- यह artists, creative coders और students के लिए सरल और intuitive interface प्रदान करती है
- p5.js और Processing की philosophy को आगे बढ़ाते हुए, यह code accessibility बढ़ाती है और learning process को आसान बनाती है
- इसमें image recognition, text analysis, pose estimation जैसी कई सुविधाएं शामिल हैं, इसलिए beginners भी इसे आसानी से उपयोग कर सकते हैं
-
WebLLM: ब्राउज़र के भीतर उच्च-प्रदर्शन LLM inference engine
- WebLLM एक high-performance inference engine है जो ब्राउज़र में सीधे large language models (LLM) चला सकता है
- WebGPU के जरिए GPU acceleration का उपयोग कर तेज़ inference performance प्रदान करता है
- सभी calculations क्लाइंट-साइड पर होती हैं, जिससे privacy बेहतर होती है और किसी setup की ज़रूरत नहीं पड़ती
- यह OpenAI API शैली का interface देता है, जिससे standardized integration संभव होती है और chat applications, structured JSON generation जैसे कई use cases सपोर्ट होते हैं
-
LangChain के जरिए ब्राउज़र के भीतर LLM applications में सुधार
- LangChain, ब्राउज़र में चलने वाले छोटे LLMs का उपयोग करके applications विकसित करने का framework है
- छोटे models की सीमाओं को पार करने के लिए यह LangGraph.js से state-based applications डिज़ाइन करता है और optimized prompt techniques प्रदान करता है
- यह local LLM के लाभों, जैसे low latency और privacy, का उपयोग करते हुए limited performance issues से निपटने के तरीके प्रस्तुत करता है
-
Visual Blocks: AI pipelines का visual prototyping
- Visual Blocks एक visual programming platform है, जो सरल drag-and-drop interface के जरिए AI pipelines का तेज़ prototyping करने देता है
- इसमें real-time data augmentation और testing संभव है, और विभिन्न custom nodes व pipelines के माध्यम से creative solutions विकसित किए जा सकते हैं
- इसमें interactive graphics, LLM chains, computer vision, multimodal solutions जैसी कई AI applications का प्रदर्शन किया गया
- इसका लक्ष्य community contributions को बढ़ावा देकर अधिक समृद्ध ML pipeline ecosystem बनाना है
-
Chrome की built-in AI capabilities का overview
- Prompt API और high-level task APIs (summary, text rewriting आदि) की वर्तमान स्थिति और शुरुआती user feedback साझा किए गए
- Chrome की built-in AI capabilities का उपयोग करने वाले विभिन्न applications और आगे की योजनाओं के बारे में बताया गया
- high performance और stable performance के लिए API optimization और improvements का परिचय दिया गया
-
TensorFlow.js और consumer goods industry के उपयोग के मामले
- ब्राज़ील की एक बड़ी consumer goods company द्वारा TensorFlow.js का उपयोग करके in-store marketing strategy बेहतर करने का उदाहरण साझा किया गया
- AI तकनीक का उपयोग कर real time में product identification और analysis किया गया
- यह project open source के रूप में जारी किया गया, जिससे अन्य कंपनियां भी इसका उपयोग कर सकें, और इसे उद्योग के विभिन्न use cases तक विस्तारित किया गया
-
Chrome की built-in APIs उपयोग करने का अनुभव
- Chrome APIs का उपयोग कर AI applications विकसित करने के अनुभव और उससे मिली सीखों पर चर्चा की गई
- AI-आधारित apps के performance optimization और prompt tuning techniques का परिचय दिया गया
- Synonym Finder app के उदाहरण से Prompt API के flexible उपयोग और practical tips साझा किए गए
-
वेब extensions में AI उपयोग की संभावनाएं
- Chrome extensions ब्राउज़र नियंत्रण, web content observation और UI जोड़ने की क्षमता रखते हैं, इसलिए AI features के साथ मिलकर उपयोगी extensibility प्रदान करते हैं
- web store में मौजूद AI-आधारित extensions के उदाहरणों और भविष्य की संभावनाओं पर चर्चा की गई
- AI और Chrome extensions के integration के जरिए browsing experience बेहतर करने और productivity बढ़ाने के तरीकों का परिचय दिया गया
-
WebAI के जरिए healthcare accessibility में बदलाव
- WebAI तकनीक का उपयोग करके IncludeHealth virtual physical therapy प्रदान करता है, जिससे मरीज कभी भी और कहीं भी personalized treatment पा सकते हैं
- यह लागत और accessibility की बाधाओं को कम करके अधिक मरीजों तक इलाज पहुंचाने की संभावना खोलता है
- personalized data का उपयोग करके अधिक सटीक और प्रभावी treatment प्रदान किया जाता है
-
Google Sheets के लिए Simple ML
- Google Sheets add-on के रूप में उपलब्ध Simple ML उपयोगकर्ताओं को spreadsheet के भीतर सीधे machine learning tasks करने देता है
- WebAssembly, JavaScript और Chrome की built-in AI का उपयोग करके जटिल machine learning tasks को सरल तरीके से किया जा सकता है
- open source libraries के जरिए अन्य developers को भी अपने ML solutions आसानी से बनाने में मदद मिलती है
1 टिप्पणियां
JSजोआ