PayPal: रीयल-टाइम ग्राफ डेटाबेस विश्लेषण के ज़रिए धोखाधड़ी को कैसे रोका जाए
(yozm.wishket.com)-
COVID-19 के कारण ई-कॉमर्स उद्योग में तेज़ी से वृद्धि हुई
-
डिजिटल पेमेंट बढ़ने के साथ-साथ पेमेंट धोखाधड़ी भी बढ़ी
-
PayPal रीयल-टाइम ग्राफ विश्लेषण के माध्यम से धोखाधड़ी को रोकता है
-
रीयल-टाइम गणना Apache के ओपन सोर्स ग्राफ DSL फ्रेमवर्क 'Gremlin' की बदौलत संभव हुई
-
ग्राफ तकनीक ई-कॉमर्स उद्योग में धोखाधड़ी का पता लगाने और रोकथाम में बेहद प्रभावी है
2 टिप्पणियां
काफी समय बाद कुछ ऐसे कीवर्ड दिखे, इसलिए इसे दिलचस्पी से पढ़ा।
Aerospike एक open source (APL) Key-value storage है। यह In-memory और SSD पर optimized संचालन के लिए विशेष रूप से बनाया गया है, इसलिए इसका performance बहुत अच्छा है। लेकिन मुझे पता है कि cluster के आकार, key, और value के आकार आदि पर कुछ सीमाएँ होती हैं, इसलिए इसे अपनाते समय इस पर विचार करना पड़ता है।
Key-Value storage के ऊपर query layer रखना, यहाँ Gremlin लगाया गया है, मुझे एक उचित architecture लगता है। graph query layer को शुरू से बनाना आसान नहीं होता।
हालाँकि, physical configuration के बारे में विवरण कम होना खलता है। graph database में query बहुत जटिल होती हैं, इसलिए data node और query node अलग होने पर या scale-out करते समय performance बहुत तेजी से गिरती है। जटिल queries के कारण बीच के nodes में computation के लिए अस्थायी data बहुत अधिक जमा हो जाता है, जिससे memory की कमी आसानी से हो जाती है और qps गिर जाता है।
मुझे यह जानने की उत्सुकता है कि इस समस्या को scale-up करके हल किया गया या scale-out करके। अगर scale-out किया गया, तो काश उस प्रक्रिया का थोड़ा और विस्तार से वर्णन किया गया होता।
Gremlin, Titan जैसी चीज़ें देखे हुए भी शायद 8 साल हो गए हैं, लेकिन graph database क्षेत्र में प्रगति की रफ्तार उम्मीद से उतनी तेज़ नहीं लगती।
मुख्य लेख थोड़ा कठिन था, इसलिए उसे समझना मुश्किल हो रहा था, लेकिन टिप्पणियाँ पढ़कर समझना थोड़ा आसान हो गया। धन्यवाद।