- 2022 के अंत में, Readwise के इंफ्रास्ट्रक्चर को स्केल करते समय लेख recommendation और vector embedding का उपयोग करने वाली semantic search सुविधा जोड़ने की कोशिश की गई
- relational database की लागत $5k प्रति माह थी, लेकिन vector search की लागत $20k+ प्रति माह होने के कारण, ऊँची लागत की वजह से इस फीचर का implementation छोड़ दिया गया
- मौजूदा search engine महंगे हैं और उनका संचालन कठिन है: object storage, NVMe SSD, AI और vector तकनीक की प्रगति के साथ एक नए search engine की ज़रूरत है
- मौजूदा vector database in-memory storage का उपयोग करते हैं, इसलिए उनकी लागत अधिक है
- object storage (S3, GCS) और SSD caching का उपयोग करके लागत को काफी कम किया जा सकता है
- उदाहरण: in-memory storage $2+/GB, object storage $0.02/GB
turbopuffer की डिज़ाइन
- आज के समय के अनुरूप search engine विकसित किया गया
- object storage और smart caching का उपयोग करके cost efficiency और performance दोनों हासिल किए गए
- अरबों vectors और लाखों tenants को संभाला जा सकता है
- object storage-आधारित search engine
- मौजूदा search engine relational database की replicated disk architecture का उपयोग करते हैं
- search engine को high write throughput और loose write latency की आवश्यकता होती है
- object storage और SSD/memory caching के माध्यम से लागत घटाते हुए performance बनाए रखी जाती है
- object storage native database implementation
- object storage को आधार बनाकर database बनाया गया
- उच्च reliability और unlimited scalability प्रदान करता है
- multi-tenancy और sharding के माध्यम से high availability बनाए रखता है
- ग्राहक उदाहरण
- Cursor: AI code editor, अरबों vectors को manage करते हुए लागत 10 गुना कम की
- Suno: radio फीचर
- Dot: memory फीचर
- Shapes: memory फीचर
GN⁺ का सार
- turbopuffer object storage और smart caching का उपयोग करके search engine की cost efficiency और performance में बड़ा सुधार करता है
- यह मौजूदा search engine की ऊँची लागत और संचालन की कठिनाई को हल करना चाहता है
- AI और vector तकनीक की प्रगति के अनुरूप नया search engine डिज़ाइन किया गया है
- Cursor जैसे शुरुआती ग्राहक उदाहरणों के माध्यम से लागत में कमी और performance improvement साबित किया गया है
- समान कार्यक्षमता वाले अन्य प्रोजेक्ट्स में ElasticSearch और Vector DBs शामिल हैं
1 टिप्पणियां
Hacker News राय
मैंने Simon के साथ काम किया है, और वह अपने क्षेत्र में बहुत माहिर हैं
आशा है कि Turbopuffer, Polars dataframe की तरह काम करे ताकि search API में ranking व्यक्त की जा सके
Fixie.ai की website design भी बहुत पसंद आई
Hetzner में RAM की लागत $200/TB/माह है, जो दूसरी जगहों की तुलना में 18 गुना सस्ती है
2022 से पहले भी pg_vector मौजूद था, और in-memory storage की ज़रूरत नहीं है
सोच रहा हूँ कि क्या Lucene का उपयोग करके object storage के सामने SSD cache nodes रखने वाला approach बनाया जा सकता है
यह Quickwit के source-closed version जैसा लगता है
सोच रहा हूँ कि क्या S3 में बड़े read-only database को स्टोर करके सीधे query करने के लिए कोई सामान्य solution है
ClickHouse की read latency 100ms से कम और write latency 1 सेकंड से कम है
vector database के बारे में ज़्यादा नहीं जानता, लेकिन लगता है कि इसका उपयोग मुख्य रूप से RAG और दूसरे AI-संबंधित कामों में होता है
मेरा मानना है कि object storage-first approach क्लाउड के लिए स्वाभाविक रूप से उपयुक्त है