- PostgreSQL डेटाबेसों के बीच डेटा को स्थानांतरित और ट्रांसफॉर्म करने का सबसे आसान तरीका प्रदान करता है
- रियल टाइम स्ट्रीमिंग: PostgreSQL logical replication का उपयोग करके डेटा बदलावों को लगभग रियल टाइम में स्ट्रीम करता है
- बल्क कॉपी: parallel processing सक्षम bulk copy के साथ शुरुआती डेटा synchronization तेज़ी से करता है
- शक्तिशाली ट्रांसफॉर्मेशन: regular expression आधारित ट्रांसफॉर्मेशन लागू करता है, संवेदनशील डेटा को mask करता है, और कॉलम वैल्यू के आधार पर filter करता है
- लचीली राउटिंग: टेबलों के बीच डेटा को सहज रूप से route करता है, और अलग नाम वाली टेबलों या उसी टेबल में custom column mapping के जरिए route करता है
- ट्रांसफॉर्मेशन नियमों के उदाहरण
- ईमेल पता masking: email कॉलम को masking characters में बदलना।
- फ़ोन नंबर formatting: regular expression का उपयोग करके फ़ोन नंबर का फ़ॉर्मैट बदलना।
- टेबल राउटिंग और कॉलम मैपिंग
- लचीली टेबल राउटिंग: user table को customer table में route करना, और ID व username को customer ID व customer name से map करना।
- मल्टी-टेबल राउटिंग: orders table को transactions table में route करना, और ID व total amount को transaction ID व amount से map करना।
- सामान्य उपयोग के मामले
- PostgreSQL DBs के बीच रियल टाइम डेटा replication
- डेटा ट्रांसफॉर्मेशन सहित ETL pipeline बनाना
- डेटा re-routing, masking, filtering
- बिना downtime के database migration चलाना
- PostgreSQL में event streaming
- यह कैसे काम करता है
- pg_flo, PostgreSQL के logical replication system का उपयोग करके डेटा बदलावों को capture और stream करता है।
- NATS को message broker के रूप में उपयोग करके WAL से reads को replicator और worker processes से अलग करता है, जिससे flexibility और scalability मिलती है।
- ट्रांसफॉर्मेशन और filtering, डेटा के destination तक पहुंचने से पहले लागू किए जाते हैं।
1 टिप्पणियां
Hacker News टिप्पणियाँ
pg_flo प्रोजेक्ट काफ़ी दिलचस्प लग रहा है, खासकर S3 में archive और इसका सस्ता tool version आकर्षक है
PostgreSQL logical replication का उपयोग करके main database से डेटा साफ़ करने और उसे S3 में archive करने वाले एक प्रोजेक्ट पर काम चल रहा है
Postgres CDC solutions की जाँच कर रहा हूँ, और जानना चाहता हूँ कि क्या pg_flo मददगार हो सकता है
उम्मीद है कि यह Debezium का एक विकल्प बन सकता है
pglogical, Postgres के अंदर चल सकता है, लेकिन pg_flo extension नहीं बल्कि एक external service लगता है
इस tool को आज़माने के लिए बहुत उत्साहित हूँ
Sequin की तुलना में यह कैसे अलग है?
मैं इसी तरह का tool ढूँढ रहा था, और timing बिल्कुल सही है
क्या S3 में backup करने की तुलना में replication का उपयोग करना बेहतर होगा?
यह बहुत शानदार tool है