13 पॉइंट द्वारा xguru 2024-03-19 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • यह एक उच्च-प्रदर्शन end-to-end (agent और aggregator) Observability डेटा पाइपलाइन प्लेटफ़ॉर्म है, जो उपयोगकर्ताओं को observable data पर नियंत्रण देता है
  • यह logs और metrics को collect, transform और route करके उन्हें किसी भी ऐसे vendor तक भेज सकता है जिसे आप अभी उपयोग करना चाहते हैं, और भविष्य में जिन अन्य vendors को आप चुन सकते हैं, उन्हें भी
  • यह लागत कम करता है, नया data enrichment, data security प्रदान करता है, open source है, और अन्य विकल्पों की तुलना में अधिकतम 10 गुना तेज़ होने का दावा करता है

सिद्धांत

  • विश्वसनीयता - Rust में बनाया गया है, और विश्वसनीयता इसका प्रमुख डिज़ाइन लक्ष्य है
  • End-to-end - Agent या Aggregator के रूप में deploy किया जा सकता है. Vector एक पूर्ण प्लेटफ़ॉर्म है
  • एकीकृतता - logs, metrics (beta), traces (जल्द आ रहा है). सभी डेटा के लिए एक ही tool

उपयोग के मामले

  • कुल Observability लागत में कमी
  • workflow को बाधित किए बिना vendor बदलना
  • data quality और insights में सुधार
  • agents का एकीकरण और agent fatigue को समाप्त करना
  • समग्र observability performance और reliability में सुधार

कम्युनिटी

  • Atlassian, T-Mobile, Comcast, Zendesk, Discord, Fastly, CVS, Trivago, Tuple, Douban, Visa, Mambu, Blockfi, Claranet, Instacart जैसी startups और बड़ी कंपनियाँ Vector पर निर्भर हैं
  • Vector को प्रतिदिन 100,000 से अधिक बार download किया जाता है
  • Vector का सबसे बड़ा उपयोगकर्ता प्रतिदिन 30TB से अधिक डेटा प्रोसेस करता है
  • Vector के 100 से अधिक contributors हैं और कम्युनिटी लगातार बढ़ रही है

2 टिप्पणियां

 
softer 2025-02-14

लॉग पाइपलाइन ज़बरदस्त

 
xguru 2024-03-19

Hacker News की राय

  • Vector सॉफ़्टवेयर के बारे में सकारात्मक मूल्यांकन

    • मल्टी-GB/s लॉग पाइपलाइन चलाने के लिए Vector बेहतरीन सॉफ़्टवेयर है।
    • Vector agent, DaemonSets के रूप में pod और journald लॉग इकट्ठा करता है, और Vector के protobuf protocol का उपयोग करके उन्हें केंद्रीय Vector aggregator (Deployment) तक भेजता है।
    • यह विभिन्न storage backends (s3, gcs/bigquery, loki, prom) को support करता है।
    • Documentation अच्छी है, हालांकि सामान्य patterns के examples ढूंढना कभी-कभी मुश्किल हो सकता है, लेकिन समय के साथ और users बढ़ने पर यह बेहतर हो रहा है।
    • Google में "vector dev" खोजने से अच्छे results मिलते हैं।
    • हाल ही में Prometheus pushgateway के विकल्प के रूप में counters को बेहतर तरीके से संभालने वाला contribution जोड़ा गया है।
  • लॉग स्टोरेज सिस्टम के लिए दृष्टि और अपेक्षाएँ

    • लॉग processing और storage system लगभग तैयार है, और उम्मीद है कि यह मध्यम से दीर्घ अवधि में queryable log storage system में विकसित होगा।
    • लॉग्स को Vector जैसे tools से process करके object storage में व्यापक रूप से समझे जाने वाले file formats में store किया जाता है।
    • लॉग objects को metadata store में register किया जाता है ताकि उन्हें खोजा जा सके।
    • Delta Lake या Iceberg जैसे tools बड़े और छोटे दोनों scale पर काम कर सकते हैं।
    • कई log processing pipelines एक ही storage में commit कर सकती हैं।
    • Clickhouse, DuckDB, Spark जैसे high-performance tools इसे पढ़ सकते हैं।
    • Standard formats के उपयोग से tools बदलना या एक साथ कई tools का उपयोग करना संभव हो जाता है।
  • Vector की विश्वसनीयता और उपयोगिता

    • Vector, beats या vendor-specific forwarders (chronicle forwarder, fdr) की तुलना में कहीं अधिक reliable है।
    • Vrl, aws cloudtrail और imperva abp जैसे बड़े पैमाने के logs को "pre-parse" करने में उपयोगी है।
  • Vector के उपयोग का अनुभव और सिफारिश

    • Vector इस्तेमाल करने का अनुभव रहा है; इसका setup आसान है और vrl language पर्याप्त रूप से शक्तिशाली है।
    • CLI का "check" feature configuration issues पकड़ने में मदद करता है।
    • Performance में कोई समस्या नहीं है, और यह resource-efficient भी है — इसलिए इसकी सिफारिश की जाती है।
  • Vector की बहुउपयोगिता

    • Vector सिर्फ "high-performance" से बढ़कर है; यह logs और metrics के लिए एक Swiss Army knife जैसा है।
    • इसका उपयोग logs को metrics में बदलने, metrics को दूसरे formats में बदलने, अलग-अलग data stores में push करने, और filtering जैसे कई कामों के लिए किया जाता है।
    • Observable data को collect, aggregate, filter और pre-process करने के लिए यह पहली पसंद है।
  • Vector के प्रति रुचि और अपेक्षा

    • नया fluent-bit pipeline सेटअप करने के बाद Vector के बारे में पता चला।
    • Vector में कई दिलचस्प features हैं, और समय मिलने पर इसे जल्द आज़माने की इच्छा है।
    • लगता है कि इसे किसी नए project में आज़माया जा सकता है, और यह मज़ेदार होगा।
  • Vector के उपयोग-क्षेत्र और संभावनाएँ

    • Vector के बारे में जो भी जाना है, वह ज़्यादातर databases या जटिल multi-tenant applications पर केंद्रित examples और discussions से है।
    • जिज्ञासा है कि क्या किसी ने autonomous vehicles जैसे distributed systems में Vector का उपयोग operational logs, system health, और हर application के input/output को aggregate करने के लिए किया है।
  • Vector के वास्तविक उपयोग-मामले और अतिरिक्त उपयोग की संभावनाएँ

    • लॉग forwarding के लिए Vector का उपयोग किया जा रहा है, और इसने logstash configuration की जगह ली है जो ज़रूरी काम नहीं कर पाती थी।
    • अभी Vector की संभावनाओं को बस समझना शुरू ही किया है, और इसे और ज़्यादा इस्तेमाल करने की इच्छा है।
    • लॉग forwarding के अलावा Vector के उपयोग के उदाहरणों के बारे में जानकारी चाहिए।
  • Datadog पर भरोसे की समस्या

    • इस बात पर भरोसा नहीं है कि Datadog, OTEL competitor की तरह दिखने वाले Vector को manage कर रहा है।
  • Vector की क्षमताएँ और आगे निगरानी की योजना

    • Vector दिलचस्प है, लेकिन tracing support न होने के कारण अभी इसका उपयोग नहीं किया जा सकता।
    • आने वाले कुछ महीनों तक Vector पर नज़र रखने की योजना है, और उम्मीद है कि इसमें उपयोगी features मिलेंगे।