AWS ने Amazon S3 Vectors का प्रीव्यू पेश किया

(aws.amazon.com)

11 पॉइंट द्वारा GN⁺ 2025-07-21 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

क्लाउड में पहली बार native vector support वाला बड़े पैमाने का object storage
vector data storage, upload और query की लागत अधिकतम 90% तक कम की जा सकती है, साथ ही subsecond query performance मिलती है
vector buckets और vector indexes की अवधारणा पेश की गई, ताकि AI embedding, RAG जैसे generative AI workloads के लिए बड़े पैमाने पर vector data storage और search को optimize किया जा सके
Amazon Bedrock, SageMaker, OpenSearch जैसी AWS services के साथ integration, जिससे cost और performance के बीच संतुलित vector management और real-time search संभव
infrastructure बनाए बिना console, CLI, SDK, API से आसानी से vector data को store, manage, query, export और integrate करने सहित कई उपयोग परिदृश्यों का समर्थन

Amazon S3 Vectors क्या है?

Amazon S3 Vectors बड़े vector datasets को store करने और तेज vector search (semantic/similarity search) देने के लिए S3 का नया dedicated storage है
इसे generative AI में अक्सर इस्तेमाल होने वाले vector (embedding) data को कुशलतापूर्वक manage करने के लिए design किया गया है
यह vector bucket नाम का S3 bucket का नया प्रकार प्रदान करता है; हर vector bucket में अधिकतम 10,000 vector indexes बनाए जा सकते हैं, और हर index में करोड़ों vectors store किए जा सकते हैं
हर vector के लिए metadata (key-value) जोड़ने का समर्थन, जिससे condition-based filtering queries संभव हैं

vector data के upload, storage और query की लागत अधिकतम 90% तक कम की जा सकती है
data बढ़ने पर भी S3 Vectors अपने-आप optimize करता है, जिससे cost और performance लगातार बनी रहती है
Cosine/Euclidean distance metrics उपलब्ध हैं, जो AI embedding models के साथ compatible flexible search environment देते हैं

Amazon Bedrock Knowledge Bases के साथ native integration, और SageMaker Unified Studio में सीधे उपयोग संभव
OpenSearch Service के साथ जुड़कर, long-term/low-frequency data को S3 में store किया जा सकता है, जबकि high-frequency/real-time search को OpenSearch में migrate किया जा सकता है (serverless vector collections)
recommendation systems, RAG, document analysis, personalized recommendations सहित कई AI applications के लिए उपयुक्त

console में Vector buckets menu से vector bucket बनाएं
bucket बनाते समय encryption options सेट किए जा सकते हैं (SSE-S3, SSE-KMS)
हर bucket में vector index जोड़ें, और index के अनुसार dimensions और distance metric सेट करें

AWS CLI, SDK, REST API का उपयोग करके vectors insert और manage करें
Amazon Bedrock में text embeddings बनाएं → S3 Vectors में vectors insert करें
उदाहरण: boto3 से embedding बनाने के बाद s3vectors.put_vectors API से index में data upload करें
metadata का उपयोग करके genre, category आदि शर्तों के आधार पर queries की जा सकती हैं

console के Export to OpenSearch से S3 Vector index को OpenSearch में migrate करें
serverless collection अपने-आप बनती है, और real-time vector search व analytics workloads तक विस्तार संभव होता है

S3 Vector buckets में encryption default रूप से enabled (SSE-S3) है, और KMS option का अतिरिक्त समर्थन है
CLI/SDK/REST API के जरिए automation/programmatic use
अभी preview जिन regions में उपलब्ध है: US East/West, Europe (Frankfurt), Asia (Sydney)

RAG, agent memory, similarity/semantic search, intelligent document analysis, personalized recommendations, content auto-analysis आदि जैसे कई industries के vector use cases का समर्थन
OpenSearch, SageMaker, Bedrock जैसे AWS ecosystem के साथ integration के जरिए cost-efficient और बड़े पैमाने पर scalable vector-based AI solutions बनाए जा सकते हैं