1 पॉइंट द्वारा GN⁺ 2024-12-22 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • S2 परिचय

    • S2 क्लाउड युग के लिए एक streaming data store है, जो डेटा सिस्टम के कोर को मजबूत करने का समाधान है।
    • यह मौजूदा object storage के serverless अनुभव को streaming data पर लागू करना चाहता है।
    • S2 stream को cloud storage का मूल building block मानता है।
  • अगर स्ट्रीम को ऑब्जेक्ट से प्राथमिकता दी जाए?

    • Object storage स्थिर (at-rest) डेटा के लिए उपयुक्त है, जबकि stream storage चल रहे डेटा की जरूरतें पूरी करने के लिए डिज़ाइन किया गया है।
    • S2 डेटा को रिकॉर्ड स्तर पर प्रोसेस करता है, और कई लेखक (writers) एक साथ काम करें तब भी हर रिकॉर्ड को क्रमवार संभालता है।
    • S3 के विपरीत, S2 में stream को real-time track किया जा सकता है।
  • serverless – इसकी लागत क्या है?

    • S2 को object storage की अनंत scalability और durability पर बिल्ड किया गया है।
    • उपयोगकर्ता हर stream के हिसाब से latency और cost का संतुलन सेट कर सकता है।
    • यह Standard और Express नाम की दो storage classes देता है, जो क्रमशः AWS के S3 Standard और S3 Express One Zone पर आधारित हैं।
    • Express class, disk-based cloud streaming सिस्टम जैसी latency प्रदान करती है।
  • S2 की अगली दिशा

    • S2 प्रमाणित cloud infrastructure पर आधारित है और Rust codebase का उपयोग करके टेस्ट किया गया है।
    • अभी gRPC API, Rust SDK और CLI उपलब्ध हैं, जबकि REST API भी develop की जा रही है।
    • भविष्य के योजनाओं में Kafka protocol compatibility, multi-region deployment और 5ms से कम latency का लक्ष्य शामिल है।
    • S2 उन उपयोगकर्ताओं के लिए अच्छी समाधान है जो stream count या throughput पर किसी सीमा के बिना cloud streaming चाहते हैं।

1 टिप्पणियां

 
GN⁺ 2024-12-22
Hacker News टिप्पणी
  • उत्पाद का नाम S2 रखकर उसे AWS S3 को बेहतर बनाने वाली टेक्नोलॉजी के तौर पर पेश करना Amazon से ट्रे़डमार्क इश्यू खड़ा कर सकता है
  • API अच्छी है और इसे अपने प्रोजेक्ट में इस्तेमाल करना चाहूँगा, लेकिन अभी के रूप में यह लंबा नहीं टिकेगा; अगर यह सफल हुआ तो AWS शायद इससे बेहतर वर्ज़न बना दे
    • अगर इसे Papertrail जैसी end-user product के रूप में लॉन्च किया गया होता तो शायद ज्यादा मायने रखता
    • अगर इसमें S3-compatible backend जोड़ दिया जाए तो यह शानदार cloud-independent product बन सकता है
  • यह WarpStream जैसा लगता है, लेकिन Kafka compatibility की जगह low-level API देता है
    • अगर इसे लंबे समय तक adopt किया गया तो S3-level streaming API बहुत valuable होगी
  • AWS इंटरनेट ट्रांसफर की कीमत $0.09/GB है जबकि यह $0.05/GB कैसे charge कर रहा है, समझ नहीं आता; शायद AWS के internal transfer pricing तक access नहीं मिलता
  • टेक्नोलॉजी अच्छी है, लेकिन source खुला नहीं होने का अफ़सोस है। अगर FSL जैसी license के साथ पूर्ण self-hosting support हो तो इसे commercial service के तौर पर consider करूंगा
  • लगता है इन्होने शायद यही साबित करने में अपनी पूरी ज़िंदगी लगा दी कि यह S3 नहीं है
  • कोई ऐसा बनाये जो stream 'events' को point-in-time queryable representation में बदल दे
    • शायद किसी particular डेटाबेस पैटर्न की तुलना में in-memory queryable data के लिए frameworks/patterns बेहतर होंगे
  • सभी writes को तभी मान्यता मिलती है जब वे पहले S3 में store हों—यह service model confusing लगता है
    • AWS शायद Kafka reimplementation जैसा protocol-compatible सेवा बना दे
  • Java SDK न होना खलता है क्योंकि अधिकांश कंपनियाँ Spring या Kafka client use करती हैं, इसलिए PoC करना भी मुश्किल हो जाता है
  • यह AWS Kinesis Data Streams से बहुत overlap करता है; AWS को competition मिलना अच्छा है