क्लाउड डिस्क की durability पर कितना भरोसा किया जा सकता है?

computerphilosopher · 2026-03-08T02:27:32+09:00

EBS gp3 के durability metrics: AWS के आधिकारिक दस्तावेज़ों के अनुसार annual failure rate (AFR) 0.1% ~ 0.2% है। single disk के आधार पर durability 99.9% जितनी बहुत ऊंची है, लेकिन जैसे-जैसे infrastructure का scale बढ़ता है, probabilistic risk जमा होता जाता है. scale के अनुसार failure होने की probability: जब 1,000 disks operate की जा रही हों, तब 1 साल के भीतर एक भी failure न होने की probability लगभग 36.8% ($0.999^{1000}$) होती है. यानी सांख्यिकीय रूप से लगभग 63.2% probability के साथ कम-से-कम 1 disk failure का अनुभव होगा, और यह design के समय constant की तरह माना जाने लायक risk है. storage structure के अनुसार survivability में बदलाव: distributed structure (Sharding/RAID 0): पूरे system की durability individual components की durability के गुणनफल ($R^n$) से तय होती है। disks की संख्या बढ़ने पर system के survive करने की probability exponential रूप से घटती है. replication structure (Mirroring/RAID 1): shard-प्रति failure probability को square ($Q^2$) करके कम किया जाता है, जिससे वही hardware इस्तेमाल करने पर भी पूरे system की durability में बहुत बड़ा सुधार किया जा सकता है. management strategy का विभाजन: Redundancy (RAID आदि): physical hardware की mechanical failure से निपटकर service availability और durability बनाए रखने की strategy. Backup (S3 snapshot आदि): operator की गलती, software bug, ransomware आदि जैसी 'data की logical corruption' से recovery का एकमात्र साधन। दोनों एक-दूसरे के विकल्प नहीं हैं. निष्कर्ष*: यह सच है कि cloud managed services उच्च स्थिरता देती हैं, लेकिन system की अंतिम durability individual components के specs से ज्यादा engineer की architecture design क्षमता से तय होती है.

(velog.io/@skynet)

3 पॉइंट द्वारा computerphilosopher 2026-03-08 | 1 टिप्पणियां | WhatsApp पर शेयर करें

EBS gp3 के durability metrics: AWS के आधिकारिक दस्तावेज़ों के अनुसार annual failure rate (AFR) 0.1% ~ 0.2% है। single disk के आधार पर durability 99.9% जितनी बहुत ऊंची है, लेकिन जैसे-जैसे infrastructure का scale बढ़ता है, probabilistic risk जमा होता जाता है.
scale के अनुसार failure होने की probability:
- जब 1,000 disks operate की जा रही हों, तब 1 साल के भीतर एक भी failure न होने की probability लगभग 36.8% ($0.999^{1000}$) होती है.
- यानी सांख्यिकीय रूप से लगभग 63.2% probability के साथ कम-से-कम 1 disk failure का अनुभव होगा, और यह design के समय constant की तरह माना जाने लायक risk है.
storage structure के अनुसार survivability में बदलाव:
- distributed structure (Sharding/RAID 0): पूरे system की durability individual components की durability के गुणनफल ($R^n$) से तय होती है। disks की संख्या बढ़ने पर system के survive करने की probability exponential रूप से घटती है.
- replication structure (Mirroring/RAID 1): shard-प्रति failure probability को square ($Q^2$) करके कम किया जाता है, जिससे वही hardware इस्तेमाल करने पर भी पूरे system की durability में बहुत बड़ा सुधार किया जा सकता है.
management strategy का विभाजन:
- Redundancy (RAID आदि): physical hardware की mechanical failure से निपटकर service availability और durability बनाए रखने की strategy.
- Backup (S3 snapshot आदि): operator की गलती, software bug, ransomware आदि जैसी 'data की logical corruption' से recovery का एकमात्र साधन। दोनों एक-दूसरे के विकल्प नहीं हैं.
निष्कर्ष*: यह सच है कि cloud managed services उच्च स्थिरता देती हैं, लेकिन system की अंतिम durability individual components के specs से ज्यादा engineer की architecture design क्षमता से तय होती है.

1 टिप्पणियां

neocode24 2026-03-10

लेख बहुत अच्छा लगा. ^^
आखिर यह वह आखिरी क्षेत्र है जहाँ पैसे नहीं बचाने चाहिए, है ना, हाहा

क्लाउड डिस्क की durability पर कितना भरोसा किया जा सकता है?

संबंधित पढ़ाई

1 टिप्पणियां