3 पॉइंट द्वारा computerphilosopher 2026-03-08 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • EBS gp3 के durability metrics: AWS के आधिकारिक दस्तावेज़ों के अनुसार annual failure rate (AFR) 0.1% ~ 0.2% है। single disk के आधार पर durability 99.9% जितनी बहुत ऊंची है, लेकिन जैसे-जैसे infrastructure का scale बढ़ता है, probabilistic risk जमा होता जाता है.
  • scale के अनुसार failure होने की probability:
    • जब 1,000 disks operate की जा रही हों, तब 1 साल के भीतर एक भी failure न होने की probability लगभग 36.8% ($0.999^{1000}$) होती है.
    • यानी सांख्यिकीय रूप से लगभग 63.2% probability के साथ कम-से-कम 1 disk failure का अनुभव होगा, और यह design के समय constant की तरह माना जाने लायक risk है.
  • storage structure के अनुसार survivability में बदलाव:
    • distributed structure (Sharding/RAID 0): पूरे system की durability individual components की durability के गुणनफल ($R^n$) से तय होती है। disks की संख्या बढ़ने पर system के survive करने की probability exponential रूप से घटती है.
    • replication structure (Mirroring/RAID 1): shard-प्रति failure probability को square ($Q^2$) करके कम किया जाता है, जिससे वही hardware इस्तेमाल करने पर भी पूरे system की durability में बहुत बड़ा सुधार किया जा सकता है.
  • management strategy का विभाजन:
    • Redundancy (RAID आदि): physical hardware की mechanical failure से निपटकर service availability और durability बनाए रखने की strategy.
    • Backup (S3 snapshot आदि): operator की गलती, software bug, ransomware आदि जैसी 'data की logical corruption' से recovery का एकमात्र साधन। दोनों एक-दूसरे के विकल्प नहीं हैं.
  • निष्कर्ष*: यह सच है कि cloud managed services उच्च स्थिरता देती हैं, लेकिन system की अंतिम durability individual components के specs से ज्यादा engineer की architecture design क्षमता से तय होती है.

1 टिप्पणियां

 
neocode24 2026-03-10

लेख बहुत अच्छा लगा. ^^
आखिर यह वह आखिरी क्षेत्र है जहाँ पैसे नहीं बचाने चाहिए, है ना, हाहा