7 पॉइंट द्वारा kangbit 2026-03-25 | 8 टिप्पणियां | WhatsApp पर शेयर करें

नमस्ते! मैंने 'Trump-Saith' नाम की एक सेवा बनाई है, जो पूर्व राष्ट्रपति Trump के बयानों का कोरियाई अर्थव्यवस्था और बाज़ार पर पड़ने वाले प्रभाव का रियल-टाइम विश्लेषण करके उपलब्ध कराती है.

वेबसाइट: https://trump-saith.com/ (https://trump-saith.com/)
मुख्य फ़ीचर: Trump के बयानों का रियल-टाइम संग्रह -> LLM कोरियाई सारांश -> आर्थिक प्रभाव विश्लेषण -> डुप्लिकेट हटाने के बाद फ़ीड प्रदान करना


💡 इसे क्यों बनाया?

हाल के दिनों में Trump के एक-एक बयान से घरेलू शेयर बाज़ार और विनिमय दर में तेज़ उतार-चढ़ाव बार-बार देखने को मिल रहा है. लेकिन Truth Social जैसी जगहों पर आने वाले मूल पोस्ट को लगातार ट्रैक करना मुश्किल है, और मौजूदा न्यूज़ कवरेज प्रोसेसिंग से गुज़रने के कारण धीमी रहती है.
इसीलिए मैंने इस सोच के साथ प्रोजेक्ट शुरू किया कि "बयान को सबसे तेज़ी से सीधे इकट्ठा किया जाए, और डेवलपर व निवेशक के नज़रिए से सिर्फ़ मुख्य बातें संक्षेप में दिखाई जाएँ."

🛠️ टेक स्टैक और आर्किटेक्चर

चूँकि यह डेवलपर कम्युनिटी है, मैं इम्प्लीमेंटेशन का तरीका भी साझा करना चाहता हूँ. मैंने 4 स्वतंत्र लेयर के साथ पाइपलाइन बनाई है.

  • Data Collection (Python, APScheduler)
    Truth Social API और RSS चैनलों को हर 1 मिनट पर मॉनिटर करके Raw डेटा इकट्ठा किया जाता है.
    इकट्ठा किया गया डेटा Oracle DB में स्थायी रूप से स्टोर होता है, और Redis Streams के ज़रिए asynchronous तरीके से अगली लेयर तक पहुँचाया जाता है.

  • Analysis (Gemini 2.0 Flash)
    इकट्ठा किए गए मूल पाठ का विश्लेषण Gemini 2.0 Flash मॉडल से किया जाता है.
    सिर्फ़ अनुवाद नहीं, बल्कि 'कोरियाई अर्थव्यवस्था/बाज़ार प्रभाव' के दृष्टिकोण से सारांश और keywords निकाले जाते हैं. (3-5 वाक्यों का सारांश)

  • Deduplication (Sentence-Transformers, Qdrant)
    कई चैनलों से इकट्ठा किए गए एक जैसे बयानों को प्रोसेस किया जाता है.
    all-MiniLM-L6-v2 मॉडल से sentence embeddings बनाए जाते हैं, और Qdrant(Vector DB) में cosine similarity 0.85 के आधार पर duplicates फ़िल्टर किए जाते हैं.

  • API & Feed
    अंततः परिष्कृत डेटा क्लाइंट को उपलब्ध कराया जाता है.

✨ क्या अलग है

गति: न्यूज़ आर्टिकल आने से पहले, जैसे ही Trump के मूल बयान पोस्ट होते हैं, विश्लेषण शुरू हो जाता है.
संदर्भ विश्लेषण: "इस बयान का कोरिया के semiconductor या automobile उद्योग पर क्या मतलब है?" इसे LLM prompt के माध्यम से निकाला जाता है.
क्लीन फ़ीड: similarity-आधारित डुप्लिकेशन हटाने से एक ही ख़बर के बार-बार दिखने वाले noise को न्यूनतम किया गया है.

🚀 आगे की योजना

फ़िलहाल संग्रह चैनलों का विस्तार किया जा रहा है, और आगे चलकर विशेष keywords (जैसे: Samsung Electronics, tariffs आदि) के लिए रियल-टाइम push notifications फ़ीचर जोड़ने की योजना है.
उम्मीद है कि IT और अर्थव्यवस्था के संगम में रुचि रखने वाले लोगों के लिए यह थोड़ी मददगार साबित होगी. फ़ीडबैक हमेशा स्वागतयोग्य है!
धन्यवाद.

8 टिप्पणियां

 
roxie 2026-04-01

फट गया 403

 
[यह टिप्पणी छिपाई गई है.]
 
kangbit 2026-03-27

धन्यवाद! मैंने प्रोजेक्ट रजिस्टर कर दिया है!

 
brainer 2026-03-26

"पूर्व" राष्ट्रपति

 
kangbit 2026-03-26

मैं इसे ध्यान से रिव्यू नहीं कर पाया..!

 
mhpark 2026-03-26

लगता है यह 2021.01 ~ 2025.01 के training data वाले मॉडल से लिखी गई पोस्ट है lol

 
dankim0124 2026-03-25

काफ़ी स्टाइलिश

लेकिन क्या आर्थिक प्रभाव का विश्लेषण वही है, जिसमें हर कार्ड पर सारांश की तरह एक-दो वाक्य हैं?
अगर नहीं, तो अभी मेरी स्क्रीन पर "प्रभाव विश्लेषण" की जानकारी दिखाई नहीं दे रही है।

 
kangbit 2026-03-26

इसे अलग से दिखाया नहीं जा रहा है.
लगता है, हमें एक बार यह चर्चा करनी होगी कि क्या summary में impact analysis की सामग्री को और मज़बूत किया जा सकता है.
धन्यवाद!