S3 का निर्माण और संचालन
- S3, Amazon Simple Storage Service का संक्षिप्त नाम है, और यह एक बड़े पैमाने की storage system को दर्शाता है।
- Andy Warfield ने S3 में काम करते हुए सिस्टम के बारे में व्यापक समझ हासिल की।
- S3 एक ऐसी सेवा है जो ग्राहकों के performance experience से लेकर hard disk mechanics तक, कई क्षेत्रों को समेटती है।
17 साल पहले, एक दूरस्थ विश्वविद्यालय परिसर में...
- S3 को 14 मार्च 2006 को लॉन्च किया गया था, और इस साल इसकी 17वीं वर्षगांठ है।
- Warfield ने University of Cambridge से PhD पूरी की, Xen project में भाग लिया, और बाद में XenSource नाम का एक startup सह-स्थापित किया।
- XenSource बढ़कर Citrix द्वारा अधिग्रहित हुआ, और Warfield ने business growth और team management के बारे में बहुत कुछ सीखा।
S3 कैसे काम करता है
- Amazon में शामिल होने के बाद Warfield ने Seth Markle, जो S3 के शुरुआती engineers में से एक थे, से S3 के काम करने का तरीका सीखा।
- S3, HTTP REST API वाला एक object storage service है, जो frontend, namespace service, hard disk वाले storage fleet, और background jobs चलाने वाले fleet से बना है।
- S3 सैकड़ों microservices से बना है, और टीमों के बीच interaction API-स्तरीय contracts के माध्यम से होता है।
शुरुआती अवलोकन
- S3 सिर्फ software से आगे बढ़कर hardware और लोगों को शामिल करने वाला लगातार विकसित होता ecosystem है।
- S3 का scale ऐसा है कि इसका हर component scale-out services के समूह से बना है, इसलिए सिस्टम के पैमाने को समझने में समय लगता है।
तकनीकी पैमाना: storage की physics
- S3 लाखों hard disks का उपयोग करने वाला बेहद बड़ा सिस्टम है।
- Hard drives technology और innovation का चमत्कार हैं, और cost efficiency के मामले में बहुत उत्कृष्ट हैं।
heat management: data placement और performance
- S3 में 'heat management' की समस्या को हल करने के लिए I/O requests को कई hard drives पर समान रूप से वितरित करने वाले optimization किए जाते हैं।
replication: data placement और durability
- S3 data durability सुनिश्चित करने और heat को manage करने के लिए replication और erasure coding जैसी redundancy schemes का उपयोग करता है।
scale का प्रभाव: data placement strategy
- डेटा को जितना संभव हो उतनी अधिक disks पर व्यापक रूप से रखकर, ग्राहक के data को हर disk पर बहुत कम मात्रा में रखा जाता है, जिससे workload isolation हासिल होता है।
मानवीय तत्व
- S3 की जटिलता सिर्फ तकनीकी तत्वों से नहीं, बल्कि मानवीय तत्वों से भी आती है।
- Amazon engineers और teams को तेज़ी से और सुरक्षित तरीके से fail होने, और high-durability storage प्रदान करने पर केंद्रित रहने के लिए प्रोत्साहित करता है।
मेरा अपना विस्तार: 'ownership' से शुरू और खत्म होने वाली कठिन समस्याओं का समाधान
- Warfield ने Amazon में अपने व्यक्तिगत scale के विस्तार का अनुभव किया, और software, लोगों तथा business के scale के बारे में सीखा।
- Amazon में 'ownership' पर ज़ोर दिया जाता है, जो organization structure और engineering approach को समझने में मदद करता है।
GN⁺ की राय
- S3 सिर्फ एक storage service नहीं, बल्कि hardware, software और मानवीय तत्वों से बना एक जटिल ecosystem है।
- यह लेख S3 के scale और complexity को समझना चाहने वाले शुरुआती software engineers के लिए उपयोगी insight देता है।
- Amazon की 'ownership' culture एक महत्वपूर्ण तत्व है, जो teams और individuals को अधिक ज़िम्मेदारी के साथ innovation आगे बढ़ाने के लिए प्रेरित करती है।
1 टिप्पणियां
Hacker News राय
Genomics क्षेत्र में काम करते हुए, पिछले 10 सालों में मैंने कई petabyte data stores संभाले हैं।
अगर S3 OAuth2-आधारित protocol का उपयोग करके read/write access delegate कर सके, तो हम कितनी चीज़ें बना सकते हैं।
Distributed systems में authentication संभालना बहुत कठिन है।
Amazon कर्मचारियों को S3 के internal workings के बारे में खुलकर बात करते देखना अच्छा लगता है।
वह हिस्सा जहाँ hard drive head को 747 airplane से तुलना करके समझाया गया है।
S3 KeyMap के दिनों में वापस जाएँ तो, सबसे hot objects/partitions/buckets पहचान लेने के बाद भी यह सीखा कि सिर्फ़ उन्हें move कर देने से समस्या हल नहीं होती।
S3 सिर्फ़ एक storage नहीं, बल्कि एक standard है।