Trump Saith: Trump के बयानों का रियल-टाइम विश्लेषण और कोरियाई अर्थव्यवस्था प्रभाव फ़ीड
(trump-saith.com)नमस्ते! मैंने 'Trump-Saith' नाम की एक सेवा बनाई है, जो पूर्व राष्ट्रपति Trump के बयानों का कोरियाई अर्थव्यवस्था और बाज़ार पर पड़ने वाले प्रभाव का रियल-टाइम विश्लेषण करके उपलब्ध कराती है.
वेबसाइट: https://trump-saith.com/ (https://trump-saith.com/)
मुख्य फ़ीचर: Trump के बयानों का रियल-टाइम संग्रह -> LLM कोरियाई सारांश -> आर्थिक प्रभाव विश्लेषण -> डुप्लिकेट हटाने के बाद फ़ीड प्रदान करना
💡 इसे क्यों बनाया?
हाल के दिनों में Trump के एक-एक बयान से घरेलू शेयर बाज़ार और विनिमय दर में तेज़ उतार-चढ़ाव बार-बार देखने को मिल रहा है. लेकिन Truth Social जैसी जगहों पर आने वाले मूल पोस्ट को लगातार ट्रैक करना मुश्किल है, और मौजूदा न्यूज़ कवरेज प्रोसेसिंग से गुज़रने के कारण धीमी रहती है.
इसीलिए मैंने इस सोच के साथ प्रोजेक्ट शुरू किया कि "बयान को सबसे तेज़ी से सीधे इकट्ठा किया जाए, और डेवलपर व निवेशक के नज़रिए से सिर्फ़ मुख्य बातें संक्षेप में दिखाई जाएँ."
🛠️ टेक स्टैक और आर्किटेक्चर
चूँकि यह डेवलपर कम्युनिटी है, मैं इम्प्लीमेंटेशन का तरीका भी साझा करना चाहता हूँ. मैंने 4 स्वतंत्र लेयर के साथ पाइपलाइन बनाई है.
-
Data Collection (Python, APScheduler)
Truth Social API और RSS चैनलों को हर 1 मिनट पर मॉनिटर करके Raw डेटा इकट्ठा किया जाता है.
इकट्ठा किया गया डेटा Oracle DB में स्थायी रूप से स्टोर होता है, और Redis Streams के ज़रिए asynchronous तरीके से अगली लेयर तक पहुँचाया जाता है. -
Analysis (Gemini 2.0 Flash)
इकट्ठा किए गए मूल पाठ का विश्लेषण Gemini 2.0 Flash मॉडल से किया जाता है.
सिर्फ़ अनुवाद नहीं, बल्कि 'कोरियाई अर्थव्यवस्था/बाज़ार प्रभाव' के दृष्टिकोण से सारांश और keywords निकाले जाते हैं. (3-5 वाक्यों का सारांश) -
Deduplication (Sentence-Transformers, Qdrant)
कई चैनलों से इकट्ठा किए गए एक जैसे बयानों को प्रोसेस किया जाता है.
all-MiniLM-L6-v2 मॉडल से sentence embeddings बनाए जाते हैं, और Qdrant(Vector DB) में cosine similarity 0.85 के आधार पर duplicates फ़िल्टर किए जाते हैं. -
API & Feed
अंततः परिष्कृत डेटा क्लाइंट को उपलब्ध कराया जाता है.
✨ क्या अलग है
गति: न्यूज़ आर्टिकल आने से पहले, जैसे ही Trump के मूल बयान पोस्ट होते हैं, विश्लेषण शुरू हो जाता है.
संदर्भ विश्लेषण: "इस बयान का कोरिया के semiconductor या automobile उद्योग पर क्या मतलब है?" इसे LLM prompt के माध्यम से निकाला जाता है.
क्लीन फ़ीड: similarity-आधारित डुप्लिकेशन हटाने से एक ही ख़बर के बार-बार दिखने वाले noise को न्यूनतम किया गया है.
🚀 आगे की योजना
फ़िलहाल संग्रह चैनलों का विस्तार किया जा रहा है, और आगे चलकर विशेष keywords (जैसे: Samsung Electronics, tariffs आदि) के लिए रियल-टाइम push notifications फ़ीचर जोड़ने की योजना है.
उम्मीद है कि IT और अर्थव्यवस्था के संगम में रुचि रखने वाले लोगों के लिए यह थोड़ी मददगार साबित होगी. फ़ीडबैक हमेशा स्वागतयोग्य है!
धन्यवाद.
8 टिप्पणियां
फट गया 403
धन्यवाद! मैंने प्रोजेक्ट रजिस्टर कर दिया है!
"पूर्व" राष्ट्रपति
मैं इसे ध्यान से रिव्यू नहीं कर पाया..!
लगता है यह 2021.01 ~ 2025.01 के training data वाले मॉडल से लिखी गई पोस्ट है lol
काफ़ी स्टाइलिश
लेकिन क्या आर्थिक प्रभाव का विश्लेषण वही है, जिसमें हर कार्ड पर सारांश की तरह एक-दो वाक्य हैं?
अगर नहीं, तो अभी मेरी स्क्रीन पर "प्रभाव विश्लेषण" की जानकारी दिखाई नहीं दे रही है।
इसे अलग से दिखाया नहीं जा रहा है.
लगता है, हमें एक बार यह चर्चा करनी होगी कि क्या summary में impact analysis की सामग्री को और मज़बूत किया जा सकता है.
धन्यवाद!