7 पॉइंट द्वारा GN⁺ 2024-12-23 | 3 टिप्पणियां | WhatsApp पर शेयर करें
  • हाल के समय में कई कंपनियों में क्लाउड छोड़कर अपने हार्डवेयर पर वापस लौटने यानी क्लाउड रिपैट्रीएशन पर चर्चा बढ़ी है
  • Fastmail ने पिछले 20 वर्षों से अपने bare metal servers का उपयोग करके ऑपरेशन्स को ऑप्टिमाइज़ किया है
  • अपने हार्डवेयर पर काम करने से क्लाउड की तुलना में लागत को बेहतर तरीके से ऑप्टिमाइज़ किया जा सकता है:
    • उपयोग के पैटर्न को सही तरीके से समझकर हार्डवेयर खरीद की लंबी अवधि की योजना बनाना
    • 25 वर्षों में हार्डवेयर और नेटवर्किंग इंस्टॉलेशन/ऑपरेशन का अनुभव
    • हार्डवेयर को 5~10 साल तक इस्तेमाल करके खर्च का बेहतर अवमूल्यन

हार्डवेयर का विकास

  • शुरुआती IMAP servers में 15k RPM SAS drives और 7.2k RPM SATA drives से बने RAID का उपयोग होता था
  • ईमेल डेटा पहले high-speed SAS drives पर रखा जाता था और फिर सर्वर लोड कम होने पर SATA drives पर शिफ्ट कर दिया जाता था
  • यह सिस्टम Cyrus IMAP और अलग partition tooling के जरिए support किया जाता था

NVMe SSD में स्विच

  • कुछ साल पहले AMD-based 2U platform और NVMe SSD के साथ बड़े पैमाने पर upgrade किया गया
    • performance और storage density दोनों में बड़ा सुधार हुआ
  • RAID controller की कमी की समस्या के कारण ZFS file system अपनाया गया
  • ZFS का Copy-on-write model उत्कृष्ट I/O performance देता है

ZFS कम्प्रेशन और ट्यूनिंग

  • Zstandard compression से ईमेल डेटा में करीब 40% जगह की बचत हुई
  • ZFS record size tune करके compression efficiency और बेहतर की गई:
    • 128k record size पर बेसिक रूप में करीब 40% बचत
    • 512k पर adjust करने पर 42% बचत

ZFS encryption और एकीकरण

  • पुराने LUKS encryption की जगह ZFS built-in encryption लगाने से सिस्टम की complexity कम हुई
  • 3 वर्षों में सभी email servers, databases, logs और backup servers पर ZFS लागू कर लिया गया

SSD की lifespan और reliability

  • SSD की lifespan और reliability को verify करने के बाद:
    • डेटा सेंटर SSDs ने 3 साल में बहुत ही कम failure rate दिखाया
    • HDD की तुलना में 10x से अधिक reliability रही

स्टोरेज लागत तुलना

क्लाउड स्टोरेज

  • Amazon S3: $252,000 प्रति वर्ष
  • Backblaze B2: $72,000 प्रति वर्ष
  • फायदे: unlimited storage, कई providers का विकल्प
  • नुकसान: implementation complexity और खर्च के लगातार बढ़ने की संभावना

HDD अपग्रेड

  • 24TB HDD अपग्रेड लागत: लगभग $6,000/सर्वर
  • फायदे: पुराने हार्डवेयर का reuse, कम खर्च
  • नुकसान: data recovery time बढ़ना, I/O performance की कमी

SSD NVMe सर्वर

  • 2U SSD server: $190,000 (1220TB storage capacity)
  • फायदे: उच्च I/O performance, reliability, space और power में बचत
  • नुकसान: शुरुआती खर्च ज्यादा

अंतिम चयन और परिणाम

  • NVMe SSD आधारित ZFS servers पर switch:
    • उच्च performance और भरोसा (reliability) सुनिश्चित
    • मौजूदा सिस्टम के साथ compatibility और कोई नया development नहीं
    • डेटा ट्रांसफर स्पीड: 5GB/s से अधिक

निष्कर्ष

  • इन-हाउस हार्डवेयर ऑपरेशन सभी के लिए सही विकल्प नहीं, लेकिन लंबे समय में खर्च कम करने और control बढ़ाने में मदद कर सकता है
  • Fastmail ने अपने हार्डवेयर से stability और cost efficiency दोनों हासिल किए

3 टिप्पणियां

 
colossus 2024-12-24

AZ यूनिट के स्तर पर availability सुनिश्चित होने के बारे में भी उत्सुकता है।

 
spp00 2024-12-23

सच कहूँ तो जो कंपनी क्लाउड का इस्तेमाल किए बिना ऐसे ही ठीक चल रही हो, वह दो में से किसी एक वजह से होती है। या तो कंपनी की टीम का कौशल स्तर बहुत मजबूत होता है, इसलिए वास्तव में वह अच्छी तरह चल रही होती है, या फिर टीम का स्तर कमजोर होता है और कम उपलब्धता व कमजोर सुरक्षा वाला सिस्टम होने पर भी बाहर से लगता है कि सब ठीक चल रहा है। कोरिया में दूसरा केस ही साफ़ तौर पर ज़्यादा दिखता है। कुछ चुनिंदा विशेषज्ञ पेशों को छोड़ दें, तो कोरिया में लोगों को पर्याप्त महत्व नहीं दिया जाता, इसलिए ऐसे माहौल में बेहतर यही है कि अच्छे प्रतिभा-आधारित विदेशी CSP को जिम्मेदारी सौंप दी जाए। या फिर सच में लोगों में निवेश किया जाए....

साफ तौर पर कहें तो अगर ट्रैफिक/यूज़र स्थिर हैं, तो क्लाउड न इस्तेमाल करने से खर्च कम आ सकता है; लेकिन उच्च उपलब्धता और सुरक्षा के साथ इसे सही ढंग से चलाने के लिए कंपनी में फिजिकल सर्वर चलाने वाली प्रतिभा होनी ज़रूरी है। अगर ऐसे लोग नहीं हैं तो क्लाउड इस्तेमाल करना ही सही विकल्प है। और ऐसी प्रतिभा को रखने/हायर करने की क्षमता न रखने वाली startup के लिए क्लाउड पर जाना कोई ‘बस यूँ ही’ का मामला नहीं होता।

क्लाउड न इस्तेमाल करने वाली 37Signals भी टैलेंट पर फोकस करते हुए न्यूनतम सैलरी तय करती है, और वह सीमा लगभग 70,000 डॉलर है—डॉलर रेट बढ़ने पर यह कोरियाई वॉन में 1 करोड़ (100 मिलियन) से ऊपर बैठती है। कोरिया के IT प्रोफेशनल्स को 37Signals की उस न्यूनतम सीमा से कम सैलरी मिलना आम बात है। वहाँ लोग ही संसाधन मानकर भारी निवेश किया जाता है, इसलिए ऑन-प्रेमाइस चलाने में सक्षम अच्छे लोगों की टीम होने के बावजूद क्लाउड पर खर्च बहुत ज़्यादा जाने लगा, इसलिए वे bare-metal पर वापस गए। साथ ही उन्होंने Kamal जैसी चीज़ भी बना दी। लेकिन क्या कोरियाई कंपनियों में Kamal जैसा कुछ बनाने की क्षमता होगी? अगर लोगों में निवेश नहीं करना चाहते, तो सीधे AWS जैसी CSP का इस्तेमाल करना ही ठीक है। सिर्फ on-premise होना किसी सिस्टम को सुरक्षित नहीं बनाता—इस बात की पुष्टि Kadokawa hacking case से हो चुकी है।

 
GN⁺ 2024-12-23
Hacker News टिप्पणियाँ
  • FastMail द्वारा हार्डवेयर खुद इस्तेमाल करने का कारण यह था कि कंपनी की शुरुआत 1999 में होने के समय विकल्प बहुत कम थे। उन्होंने Rackspace का सिर्फ एक सर्वर इस्तेमाल किया, और उस समय खर्च लगभग $70 प्रति माह था। तब VPS या SaaS के वास्तविक विकल्प उपलब्ध नहीं थे।

    • Rob के जुड़ने के बाद, जब सर्वर बढ़ने लगा, उन्होंने colocation पर विचार किया। IBM और NYI ने remote support और hardware की समस्याओं को बहुत अच्छे से संभाला।
    • Bron के शामिल होने के बाद उन्होंने सब कुछ automate किया। Linux, open source tools और Perl का उपयोग करके इसे किफ़ायती और भरोसेमंद तरीके से चलाया।
    • AWS जैसी cloud सेवाएँ लोकप्रिय होने के बाद भी, कीमत और complexity के कारण उन्होंने अभी भी bare-metal servers को प्राथमिकता दी।
    • SaaS पर बढ़ती निर्भरता को लेकर चिंता तो है, लेकिन इसके लिए वे एक training program की योजना बना रहे हैं।
  • Cloud पर शिफ्ट होने वाला यह केस रोचक है। ज़्यादातर लोग hardware management में दिलचस्पी नहीं रखते, लेकिन खर्च के लिहाज़ से इन-हाउस सिस्टम बेहतर साबित होता है।

    • Cloud के पक्ष में दलीलें अक्सर उन लोगों को convince करने के लिए होती हैं जो तकनीकी रूप से गहराई से समझ नहीं रखते।
    • Cloud को support करने के कारण लागत, privacy, security और इंटरनेट की centralization को रोकना हैं।
    • FastMail का approach काफी संतुलित और non-emotional है, इसलिए प्रभावित करता है। लगता है cloud को लेकर जो hype था वह कम होता जा रहा है।
  • Cloud का DevOps के shift-left से संबंध है; इसका मकसद सिर्फ cost savings नहीं है।

    • हार्डवेयर पर system provisioning में काफी समय लगता है, जबकि cloud में इसे आसान स्क्रिप्ट से किया जा सकता है।
    • यदि workload पूर्वानुमानित हो और strong engineering culture मौजूद हो, तो cloud आवश्यक न भी हो सकता है।
  • FastMail पर भरोसा नहीं। Pobox को खरीदने के बाद service ने email forwarding में काम नहीं किया, और उन्होंने refund देने से भी इनकार कर दिया।

  • उन्होंने BareMetalSavings.com का उल्लेख किया; जो cloud से बाहर निकलने की लागत का अनुमान लगा सकता है।

    • ZFS encryption कुछ मामलों में unstable हो सकता है, इसलिए सावधान रहना ज़रूरी है।
  • FastMail के approach में दिलचस्पी है; SSD के बारे में दो interesting बातें बताई।

    • SSD drives की विश्वसनीयता HDD से कहीं ज्यादा है।
  • FastMail की transparency और logical फैसलों में मुझे जो चीजें पसंद आईं, उससे email service के लिए कीमत चुकाना वाजिब लगता है।

  • Self-hosting के cloud से बेहतर होने पर बहुत राय है। लेकिन business applications को असरदार तरीके से कैसे चलाया जाए, इस पर चर्चा कम है।

    • infrastructure management के लिए कई फीचर्स की जरूरत होती है। केवल SaaS पर निर्भर रहना, on-premise infrastructure रखने के मकसद को कम कर सकता है।
  • Cloud उपयोग का एक फायदा छोटे पैमाने पर better reliability मिलना है।

    • AWS का उपयोग करके लगता है कि छोटा स्केल हो तो cloud ही best option रहता है।
  • FastMail ईमेल providers में से एक बेहतरीन सेवा थी। Interface intuitive था और response तेज था।

    • मैंने Protonmail पर स्विच किया, लेकिन FastMail का user experience इतना बेहतर था कि वापस आने पर seriously consider कर रहा हूँ।