musn129: अमेरिकी stock news सारांश सेवा
(musn129.com)यह एक ऐसी सेवा है जो अमेरिकी stock news को इकट्ठा करके यह सारांश देती है कि कीमतें क्यों बढ़ीं या गिरीं।
उदाहरण के लिए, सबसे हालिया 2022-10-21 के Netflix मामले में the company is reinvesting a huge chunk of its profits at a high rate of return जैसे सारांश के साथ मूल news article का लिंक भी उपलब्ध कराया जाता है।
मुझे अमेरिकी stocks में काफी रुचि है, लेकिन सुबह उठकर यह जानने के लिए कि क्या क्यों बढ़ा या गिरा, हर बार अलग-अलग खोजकर देखना असुविधाजनक था, इसलिए मैंने इसे बनाया। सोचा, शायद यह किसी के काम आए, इसलिए साझा कर रहा हूँ।
तकनीकी रूप से यह इस प्रकार है।
- Fully Serverless (AWS Lambda + Cloudfront Lambda@Edge) पर निर्मित
- अमेरिकी stocks से संबंधित news को crawl करने के बाद SQuAD नामक machine learning model से परिणाम infer किए जाते हैं (उदा.
Why Nvidia stock goes up?)- मॉडल को Lambda पर पर्याप्त रूप से चलाने के लिए lightweight model इस्तेमाल किया गया है (Distillation BERT श्रेणी)
- डेटा बनाने वाले सभी Lambda, AWS Free Tier की सीमा के भीतर चलते हैं, और अतिरिक्त लागत केवल S3 तथा Route 53 domain लागत है (फ़िलहाल लगभग $2 प्रति माह)
- सभी डेटा S3 में संग्रहित हैं, अलग से कोई DB उपयोग नहीं किया गया है
- SSR (NextJs) + Cloudfront Lambda@Edge (us-east-1)
मैं हमेशा यहाँ की पोस्टें अच्छे से पढ़ता हूँ और बहुत से लोगों का आभारी हूँ। यह लिखते समय आशा थी कि जिन लोगों की इसमें रुचि है, उन्हें थोड़ा बहुत ही सही, मदद मिल सके। धन्यवाद।
21 टिप्पणियां
नमस्ते। पहले चलाए गए साइड प्रोजेक्ट musn129 (Meoseon129) में बड़ा बदलाव हुआ है, इसलिए साझा कर रहा/रही हूँ.
सबसे पहले, इतना रुचि दिखाने और लगातार इस्तेमाल करने वाले सभी लोगों का मैं दिल से धन्यवाद कहना चाहता/चाहती हूँ।
पहले लागत अनुकूलन के लिए सारा computation AWS Lambda पर किया जाता था, और model inference के लिए Distillation BERT से SQuAD Task हल कराया जाता था (e.g. लेख के भीतर "यह stock क्यों बढ़ा?" जैसा प्रश्न देकर, उसका उत्तर लेख में "किस स्थान" पर है यह ढूँढने के लिए)। अब इसे OpenAI के paid API इस्तेमाल करने वाले रूप में बदल दिया गया है। नए मॉडल से गणना किया गया डेटा 2023 से लागू किया गया है। (2022 का डेटा पुराना ही है)
इमेज अटैच नहीं हो रही, इसलिए अंत में आज की तारीख के हिसाब से सबसे बड़ा उतार-चढ़ाव दिखाने वाले LUCID का परिणाम भी साथ छोड़ रहा/रही हूँ। (इसे https://musn129.com/nasdaq/2023-01-27 पर देख सकते हैं!)
धन्यवाद!
अगर crypto वर्ज़न बनाया जा सके तो अच्छा होगा। Crypto बाज़ार का समाचारों के साथ बहुत मज़बूत सकारात्मक सहसंबंध होता है।
वाह.. सच में बहुत बढ़िया सेवा है, धन्यवाद
इसी तरह के प्रोग्रामों में इसका user interface भी सुविधाजनक है और मुझे यह सबसे बेहतर लगा। मैंने Yahoo Finance, Dow Jones, Bloomberg आदि इस्तेमाल किए हैं (हालांकि मैं प्रोफेशनल नहीं, एक व्यक्तिगत निवेशक हूं, इसलिए अलग से प्रोग्राम तक इस्तेमाल नहीं किया), और इसमें संबंधित लेख देखना आसान लगता है। लेकिन हर व्यक्ति की अपनी रुचि के stocks होते हैं, इसलिए अकाउंट बनाना ज़रूरी न भी हो, तो भी अगर star mark करके किसी खास stock को लगातार track किया जा सके तो अच्छा होगा। मैं इसे अच्छे से इस्तेमाल करूंगा/करूंगी। धन्यवाद ^-^
मैं एक securities company में वर्तमान में काम करता/करती हूँ। मैं इसे एक service के रूप में develop करना चाहता/चाहती हूँ..??
एक बात जाननी थी, अगर मैं आपको mail भेजूँ तो क्या आप जवाब देंगे??haha
नमस्ते! रुचि दिखाने के लिए धन्यवाद। अगर आपके कोई सवाल हों तो छोड़ दीजिए, मैं जवाब दूँगा! लेकिन, अगर उसमें कोई निजी बात शामिल नहीं है, तो यहाँ छोड़ना शायद बेहतर होगा ताकि उसे दूसरे लोग भी साथ में देख और साझा कर सकें! धन्यवाद।
हाँ। मेरे मन में बहुत सारे सवाल हैं. :) मुझे तकनीकी बातें ज़्यादा नहीं पता, इसलिए आराम से एक बात पूछना चाहता/चाहती हूँ.
क्या इस प्रोजेक्ट की accuracy को थोड़ा और बढ़ाया जा सकता है?
मेरा अनुमान है कि दिशा कुछ ऐसी होगी—news की मात्रा बढ़ाना, news की quality बेहतर करना, या model की accuracy बढ़ाना.
अगर इसमें और ज़्यादा resources लगाए जाएँ, तो आपने जो service बनाई है उसकी accuracy को लगभग कितनी हद तक बढ़ाया जा सकता है, यह जानने की उत्सुकता है. haha
हाँ, मुझे लगता है कि इसे काफ़ी ज़्यादा बेहतर किया जा सकता है। मैंने यह व्यक्तिगत रूप से किया था, और क्योंकि (अभी तक) इससे कोई राजस्व नहीं है, इसलिए cost efficiency के पहलू पर काफ़ी ज़्यादा फोकस करते हुए अभी भी सुधार की बहुत गुंजाइश है।
जैसा आपने कहा, सबसे पहले high-quality data को और अधिक सुरक्षित करना सबसे महत्वपूर्ण होगा। मेरी जानकारी में news के मामले में ऐसे कई SaaS हैं जिन्होंने crawling करके data अच्छी तरह बनाया हुआ है, इसलिए अगर यह व्यक्तिगत स्तर के बजाय कोई project हो, तो उचित लागत पर बाहरी paid SaaS का उपयोग करके high-quality news articles इकट्ठा किए जा सकते हैं।
इसके बाद, अभी मैंने model के input और output के लिए preprocessing और postprocessing पर बहुत ज़्यादा ध्यान नहीं दिया है, लेकिन अगर model के results को देखते हुए बेहतर quality के outputs पाने के लिए इस पर ध्यान दिया जाए, तो user की नज़र से परिणाम काफ़ी बेहतर लगेंगे। (उदाहरण के लिए, अभी मैं कुछ छोटे जवाब, जिनका अर्थ थोड़ा कम लगता है, या ऐसे जवाब जो खाली जगह जैसे लगते हैं, उन्हें भी इसलिए छोड़ देता था क्योंकि data खुद कम था... और व्यक्तिगत तौर पर जब जिज्ञासा होती थी तो बस click करके देखना चाहता था। लेकिन अगर यह production level पर हो, तो इन चीज़ों को और अच्छी तरह व्यवस्थित करके कहीं बेहतर user experience दिया जा सकता है।)
अंत में, cost की समस्या की वजह से मैंने बहुत हल्का model सिर्फ़ एक बार इस्तेमाल किया था, लेकिन शायद कोई बड़ा model (जिसमें computation ज़्यादा लगे, लेकिन performance अपेक्षाकृत बेहतर हो) इस्तेमाल किया जा सकता है। और मैंने जो Question Answering approach अपनाई, उसके अलावा भी कई अलग तरीकों से अधिक उपयुक्त परिणाम पाए जा सकते हैं।
लिखते-लिखते यह लंबा हो गया, लेकिन उम्मीद है कि यह उन दूसरे लोगों के लिए भी मददगार होगा जिन्हें इसमें रुचि है। धन्यवाद!
बहुत शानदार है। daebak;;
अगर accuracy को पर्याप्त रूप से बढ़ाया जा सके, तो इसे तुरंत एक वास्तविक product के रूप में लागू करने तक पर भी विचार किया जा सकता है।
(ऐसा भी लगता है कि इस service को देखने वालों की comment प्रतिक्रियाओं भर से ही Preto-Type(Protox, Prito) के रूप में validation लगभग पूरी हो चुकी है haha)
एक planner के रूप में, overseas stocks के क्षेत्र में जिन सुधार बिंदुओं पर मैं सोच रहा था, वे मोटे तौर पर दो थे।
एक था भौतिक या तकनीकी Pain Point
-जैसे कि शाम में trading करनी पड़ती है / currency exchange करना पड़ता है / 15 मिनट पहले का price दिखता है / bid-ask दिखाई नहीं देता / trading के लिए उपलब्ध देशों की संख्या बहुत कम है—ऐसे local और overseas market के भौतिक अंतर से पैदा होने वाली असुविधाओं को कैसे दूर किया जाए।
लेकिन फिलहाल इस हिस्से में काफी सुधार हो चुका है। capital की ताकत... seyo haha
हाल के दिनों में जिस क्षेत्र में मेरी रुचि थी, वह information और content से जुड़ा issue था।
पहली बात, English अच्छी होनी चाहिए; और English अच्छी होने पर भी overseas information खोजना मुश्किल है, ऊपर से जानकारी इतनी ज्यादा है कि क्या और कैसे ढूँढें, यह समझना कठिन है। समय नहीं है, देखने को बहुत कुछ है, निवेश कठिन है, और बताने वाला कोई नहीं...
इसलिए securities firms आम तौर पर content team बनाती हैं, या content बाहर से खरीदती हैं, या research coverage को overseas stocks तक बढ़ाती हैं—लेकिन अभी बहुत लंबा रास्ता तय करना बाकी है। और इसमें एक-एक जगह इंसानी हाथ लगाना भी पड़ता है। इसलिए timeliness भी कम हो जाती है..
यही वजह थी कि आपके द्वारा बनाई गई service ने मुझे बहुत प्रभावित किया।
लगता है यह service रोज़मर्रा के user experience को काफी बेहतर बना सकती है। आखिरकार लोग जानना यही तो चाहते हैं—क्यों बढ़ा? क्यों गिरा?.. ऐसा ही न? haha
विस्तृत जवाब के लिए धन्यवाद! यह बहुत मददगार लगेगा। खासकर, क्योंकि आपने इस क्षेत्र में काम कर रहे व्यक्ति के तौर पर अपनी insight साझा की है, इससे सिर्फ मुझे ही नहीं बल्कि दूसरे लोगों को भी बहुत मदद मिलेगी। धन्यवाद!! haha
प्रोजेक्ट और कमेंट—दोनों के लिए धन्यवाद। लगता है यह दूसरे लोगों के लिए भी बहुत मददगार होगा!
बहुत शानदार सेवा है!
कई बार ऐसा भी होता है कि स्टॉक upper limit तक चला गया हो, लेकिन वजह ठीक से नहीं दी होती और सिर्फ यही खबर होती है कि upper limit लगा है.. ऐसे में इस तरह की खबरों को अच्छी तरह filter कैसे किया जा सकता है, यह जानने की जिज्ञासा है
नमस्ते! रुचि दिखाने के लिए धन्यवाद। मुझे लगता है कि गुणवत्ता कम होने के मुख्य रूप से दो कारण हो सकते हैं। एक यह कि मूल लेख में ही वह सामग्री पर्याप्त रूप से नहीं होती जो लोग चाहते हैं, और दूसरा यह कि machine learning model का inference परिणाम अच्छा नहीं होता। (फिलहाल यह काफ़ी naive तरीके से काम कर रहा है haha..)
अभी जब कई लेख होते हैं, तो sorting
model output scoreसे की जाती है। लेकिन बहुत छोटे वाक्य (जैसे अभी दिख रहे उदाहरण में पूरी तरह खाली या बहुत छोटे) को फ़िल्टर करना, या कुछ अतिरिक्त heuristics इस्तेमाल करना, इससे इसे जल्दी बेहतर बनाया जा सकता है। उपयोगी feedback के लिए धन्यवाद!वाह, यह बहुत अच्छा है.
मुझे लगता है कि अगर कुछ मनचाहे stocks को subscribe करके हर सुबह email में प्राप्त किया जा सके तो अच्छा होगा.
क्योंकि email में लागत आती है, इसलिए आप कम कीमत वाले किसी paid model पर भी विचार कर सकते हैं haha
अच्छी राय और आइडियाज़ के लिए धन्यवाद! haha मैं धीरे-धीरे फीचर्स जोड़कर देखूंगा। मुझे GeekNews से हमेशा बहुत प्रेरणा मिलती रही है, इसलिए इस मौके पर मैं दिल से कहना चाहता हूँ कि मैं बहुत आभारी हूँ! haha
जानना दिलचस्प होगा कि Korean stocks के लिए क्या आएगा, haha
मैं वैसे भी कोरियाई stocks को लेकर सोच रहा था, इसलिए इसे थोड़ा-थोड़ा develop करके जोड़ने की कोशिश करूंगा। दिलचस्पी दिखाने के लिए धन्यवाद haha
वाह! यह काफ़ी दिलचस्प सेवा लगती है। यह सोचकर अच्छा लग रहा है कि क्या इसी तरीके से music chart में किसी खास artist के गाने के अचानक दोबारा लोकप्रिय होने पर भी analysis किया जा सकता है।
अच्छे सुझाव के लिए धन्यवाद! इसी तरह के approach में, अगर data पर्याप्त हो तो सच में ऐसी बहुत-सी चीज़ें हो सकती हैं जिनका उपयोग किया जा सकता है!
स्टॉक्स... कभी-कभी ऊपर भी जाते हैं...? अजीब है... मेरे वाले तो बस गिरते ही रहे...
नई स्टॉक खरीदने से पहले कृपया इसे GeekNews पर साझा करें