7 पॉइंट द्वारा bluearisu 2022-01-20 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • COVID-19 के कारण ई-कॉमर्स उद्योग में तेज़ी से वृद्धि हुई

  • डिजिटल पेमेंट बढ़ने के साथ-साथ पेमेंट धोखाधड़ी भी बढ़ी

  • PayPal रीयल-टाइम ग्राफ विश्लेषण के माध्यम से धोखाधड़ी को रोकता है

  • रीयल-टाइम गणना Apache के ओपन सोर्स ग्राफ DSL फ्रेमवर्क 'Gremlin' की बदौलत संभव हुई

  • ग्राफ तकनीक ई-कॉमर्स उद्योग में धोखाधड़ी का पता लगाने और रोकथाम में बेहद प्रभावी है

2 टिप्पणियां

 
kwangyeol 2022-01-20

काफी समय बाद कुछ ऐसे कीवर्ड दिखे, इसलिए इसे दिलचस्पी से पढ़ा।

Aerospike एक open source (APL) Key-value storage है। यह In-memory और SSD पर optimized संचालन के लिए विशेष रूप से बनाया गया है, इसलिए इसका performance बहुत अच्छा है। लेकिन मुझे पता है कि cluster के आकार, key, और value के आकार आदि पर कुछ सीमाएँ होती हैं, इसलिए इसे अपनाते समय इस पर विचार करना पड़ता है।

Key-Value storage के ऊपर query layer रखना, यहाँ Gremlin लगाया गया है, मुझे एक उचित architecture लगता है। graph query layer को शुरू से बनाना आसान नहीं होता।

हालाँकि, physical configuration के बारे में विवरण कम होना खलता है। graph database में query बहुत जटिल होती हैं, इसलिए data node और query node अलग होने पर या scale-out करते समय performance बहुत तेजी से गिरती है। जटिल queries के कारण बीच के nodes में computation के लिए अस्थायी data बहुत अधिक जमा हो जाता है, जिससे memory की कमी आसानी से हो जाती है और qps गिर जाता है।

मुझे यह जानने की उत्सुकता है कि इस समस्या को scale-up करके हल किया गया या scale-out करके। अगर scale-out किया गया, तो काश उस प्रक्रिया का थोड़ा और विस्तार से वर्णन किया गया होता।

Gremlin, Titan जैसी चीज़ें देखे हुए भी शायद 8 साल हो गए हैं, लेकिन graph database क्षेत्र में प्रगति की रफ्तार उम्मीद से उतनी तेज़ नहीं लगती।

 
bluearisu 2022-01-21

मुख्य लेख थोड़ा कठिन था, इसलिए उसे समझना मुश्किल हो रहा था, लेकिन टिप्पणियाँ पढ़कर समझना थोड़ा आसान हो गया। धन्यवाद।