Fly.io, अब GPU के साथ
(fly.io)AI वाकई शानदार है
- Fly.io एक नई public cloud service है, जो computing power को users के नज़दीक तैनात कर सकती है.
- अब GPU का उपयोग करके edge computing environment में AI workloads को संभाला जा सकता है.
- Fly.io users को full-stack apps या Fly Machines API पर आधारित development platform को users के पास चलाने की सुविधा देता है.
Fly.io GPU के वास्तविक उपयोग के उदाहरण
- Fly.io के cloud backbone पर अपना code और पसंदीदा models deploy किए जा सकते हैं.
- Fly.io GPU का उपयोग करके Ollama (text generation वाले दोस्तों के लिए) चलाने वाला GPU app दो चरणों में आसानी से शुरू किया जा सकता है.
fly.tomlमें config जोड़कर औरfly apps create sandwich_ai && fly deployकमांड चलाकर app deploy किया जा सकता है.
प्रकाश की गति की भी एक सीमा है
- GPU को तेज़ी से शुरू करना अच्छा है, लेकिन Fly.io की असली ताकत edge पर inference में दिखाई देती है.
- उदाहरण के तौर पर, एक ऐसा app हो सकता है जिसमें user kitchen में मौजूद ingredients डालते ही तुरंत sandwich recipe पा सके.
- Fly.io के पास दुनिया भर के data centers में GPU हैं, और यह GPU support वाले हर region में वही program चलाने की सुविधा देता है.
केवल जब सच में ज़रूरत हो
- GPU शक्तिशाली parallel processing devices हैं, लेकिन सस्ते नहीं हैं.
fly.tomlफ़ाइल मेंservicessection जोड़कर app को scale up और scale down करने का तरीका तय किया जा सकता है.- इसे इस तरह सेट किया जा सकता है कि जब users sandwich recipe न मांग रहे हों, तब GPU की लागत न चुकानी पड़े.
विस्तृत जानकारी
- अमेरिका, यूरोप और सिडनी के कई regions में उपलब्ध GPU दिए जा रहे हैं.
- कई GPU options और pricing उपलब्ध हैं, और default रूप से हर deployment में आठ AMD EPYC CPU cores इस्तेमाल होते हैं.
- volumes को अधिकतम 500GB तक attach किया जा सकता है, और reserved instances तथा dedicated hosts पर discounts भी दिए जाते हैं.
GN⁺ की राय:
- Fly.io एक अभिनव cloud service दे रहा है, जो edge computing environment में AI workloads को संभालकर user experience बेहतर बनाने पर केंद्रित है.
- GPU आधारित यह service तेज़ inference speed और cost efficiency, दोनों को ध्यान में रखकर solution देती है, और खास तौर पर उन applications के लिए उपयुक्त है जिन्हें real-time में high computing power चाहिए.
- यह service AI तकनीक की accessibility बढ़ा सकती है और developers को नई, अभिनव applications बनाने में मदद कर सकती है, इसलिए यह एक बेहद दिलचस्प और उपयोगी प्रगति है.
1 टिप्पणियां
Hacker News की राय