Launch HN: Regatta Storage (YC F24) – S3 को लोकल-जैसे POSIX cloud file system में बदलने की तकनीक
(news.ycombinator.com)-
Regatta Storage का परिचय
- Regatta Storage एक नया cloud file system है, जो असीमित क्षमता प्रदान करता है, लोकल जैसी performance देता है, और S3-compatible storage के साथ automatic sync को support करता है
- Spark, Pytorch, pandas जैसे tools का उपयोग करके S3 के बड़े data sets को तुरंत accessible बनाता है
- अकाउंट बनाकर सेवा को मुफ्त में आज़माया जा सकता है
-
विकास की पृष्ठभूमि
- संस्थापकों ने Amazon EFS और Netflix में cloud storage को बनाने और ऑपरेट करने के अनुभव के आधार पर Regatta विकसित किया
- उन्हें EFS की सरलता और scalability पसंद थी, लेकिन Netflix में EFS का उपयोग कम था
- local disk से NFS पर workloads ले जाने पर performance समस्याएँ आती थीं
- cloud storage बाज़ार में block या file storage से हल न होने वाली समस्याओं को सुलझाने के लिए Regatta बनाया गया
-
Regatta की विशेषताएँ
- यह usage-based pricing वाला cloud file system है, जो applications के साथ अपने आप scale होता है
- यह S3 और native file formats के साथ automatically sync होता है, जिससे मौजूदा data sets से जुड़ना संभव है और S3 से सीधे file data का उपयोग किया जा सकता है
- जो data उपयोग में नहीं है, उसे Regatta cache से हटा दिया जाता है, इसलिए केवल S3 storage की लागत देनी पड़ती है
- टीम छोटे file workloads के लिए local जैसी performance और distributed data jobs के लिए Lustre जैसी scalable performance देने वाला custom file protocol विकसित कर रही है
-
तकनीकी कार्यान्वयन
- ग्राहक NFSv3 के माध्यम से Regatta file system को mount करते हैं, और caching instances ग्राहक के S3 bucket से जुड़ते हैं
- यह sub-millisecond cached read और write performance देता है, साथ ही strong consistency बनाए रखता है
- directory rename जैसे जटिल operations को तेज़ और विश्वसनीय तरीके से संभालता है, और उन्हें asynchronously S3 bucket तक propagate करता है
-
उपयोग के उदाहरण और अपेक्षाएँ
- इसका उपयोग AI researchers के लिए serverless Jupyter notebook server बनाने में किया जा रहा है
- इसे S3 के ऊपर distributed caching layer की तरह इस्तेमाल किया जा रहा है, ताकि common files तक low-latency access मिल सके
- Ceph boot volume को replace करके लागत में बचत देखी गई है
- टीम user feedback और भविष्य की दिशा के लिए ideas का स्वागत करती है, और community की राय का इंतज़ार कर रही है
1 टिप्पणियां
Hacker News टिप्पणियाँ
Rclone और Regatta Storage के बीच फर्क यह है कि filesystem mutation operations के समय Regatta high-speed caching layer का उपयोग करके strong consistency देता है। Rclone में parallel clients के बीच consistency सुनिश्चित करने वाली कोई layer नहीं है
यह YC से निकले सबसे शानदार products में से एक है, और यह कैसे काम करता है इस पर कई सवाल हैं
GCP Filestore का उपयोग करके DuckDB host किया जा रहा है, और Regatta की pricing तथा performance के बारे में जानकारी मांगी गई है
SQLite/DuckDB/parquet के backup disk के रूप में इसमें रुचि है, और instance-local NVMe storage पर cached reads चाहिए
NFS को protocol के रूप में उपयोग करना अच्छा विचार माना गया है
इस बात की चिंता है कि AWS इस product की नकल करके इसे और कम कीमत पर दे सकता है
2008 में Adobe के CEO के सामने iPhone से ली गई photo के Mac पर अपने-आप file के रूप में दिखाई देने वाला demo सफलतापूर्वक दिखाने का अनुभव साझा किया गया है
यह जानना है कि क्या Lambda + SQLite + Regatta का उपयोग करके real-time ACID SQL storage बनाया जा सकता है
यह स्पष्ट नहीं है कि file update conflicts को कैसे handle किया जाता है
s3fs, rclone, goofys आदि जैसे उल्लेखनीय alternatives मौजूद हैं