34 पॉइंट द्वारा eipi10 2022-10-23 | 21 टिप्पणियां | WhatsApp पर शेयर करें

यह एक ऐसी सेवा है जो अमेरिकी stock news को इकट्ठा करके यह सारांश देती है कि कीमतें क्यों बढ़ीं या गिरीं।

उदाहरण के लिए, सबसे हालिया 2022-10-21 के Netflix मामले में the company is reinvesting a huge chunk of its profits at a high rate of return जैसे सारांश के साथ मूल news article का लिंक भी उपलब्ध कराया जाता है।

मुझे अमेरिकी stocks में काफी रुचि है, लेकिन सुबह उठकर यह जानने के लिए कि क्या क्यों बढ़ा या गिरा, हर बार अलग-अलग खोजकर देखना असुविधाजनक था, इसलिए मैंने इसे बनाया। सोचा, शायद यह किसी के काम आए, इसलिए साझा कर रहा हूँ।

तकनीकी रूप से यह इस प्रकार है।

  • Fully Serverless (AWS Lambda + Cloudfront Lambda@Edge) पर निर्मित
  • अमेरिकी stocks से संबंधित news को crawl करने के बाद SQuAD नामक machine learning model से परिणाम infer किए जाते हैं (उदा. Why Nvidia stock goes up?)
    • मॉडल को Lambda पर पर्याप्त रूप से चलाने के लिए lightweight model इस्तेमाल किया गया है (Distillation BERT श्रेणी)
  • डेटा बनाने वाले सभी Lambda, AWS Free Tier की सीमा के भीतर चलते हैं, और अतिरिक्त लागत केवल S3 तथा Route 53 domain लागत है (फ़िलहाल लगभग $2 प्रति माह)
    • सभी डेटा S3 में संग्रहित हैं, अलग से कोई DB उपयोग नहीं किया गया है
  • SSR (NextJs) + Cloudfront Lambda@Edge (us-east-1)

मैं हमेशा यहाँ की पोस्टें अच्छे से पढ़ता हूँ और बहुत से लोगों का आभारी हूँ। यह लिखते समय आशा थी कि जिन लोगों की इसमें रुचि है, उन्हें थोड़ा बहुत ही सही, मदद मिल सके। धन्यवाद।

21 टिप्पणियां

 
eipi10 2023-01-28

नमस्ते। पहले चलाए गए साइड प्रोजेक्ट musn129 (Meoseon129) में बड़ा बदलाव हुआ है, इसलिए साझा कर रहा/रही हूँ.

सबसे पहले, इतना रुचि दिखाने और लगातार इस्तेमाल करने वाले सभी लोगों का मैं दिल से धन्यवाद कहना चाहता/चाहती हूँ।

पहले लागत अनुकूलन के लिए सारा computation AWS Lambda पर किया जाता था, और model inference के लिए Distillation BERT से SQuAD Task हल कराया जाता था (e.g. लेख के भीतर "यह stock क्यों बढ़ा?" जैसा प्रश्न देकर, उसका उत्तर लेख में "किस स्थान" पर है यह ढूँढने के लिए)। अब इसे OpenAI के paid API इस्तेमाल करने वाले रूप में बदल दिया गया है। नए मॉडल से गणना किया गया डेटा 2023 से लागू किया गया है। (2022 का डेटा पुराना ही है)

इमेज अटैच नहीं हो रही, इसलिए अंत में आज की तारीख के हिसाब से सबसे बड़ा उतार-चढ़ाव दिखाने वाले LUCID का परिणाम भी साथ छोड़ रहा/रही हूँ। (इसे https://musn129.com/nasdaq/2023-01-27 पर देख सकते हैं!)

2023.01.27 LUCID (+43%)  
- Shares of electric vehicle maker Lucid Group Inc (NASDAQ: ) nearly doubled intra-day Friday on rumors reported at Betaville that Saudi Arabia's Public Investment Fund is working on plans to buy the remaining stake that it doesn’t own.  
- On Friday, the market rally accentuated by rips higher in some battered and bruised technology stocks that faltered last year are making this year's price action look a lot like 2021's rally.  
- The luxury EV maker's stock is increasing in price due to a rumor that Saudi Arabia's public wealth fund is preparing to take it private.  
- The Saudi Public Investment Fund is considering buying more shares of Lucid Group, sending the company's stock soaring.  
- Investors are betting that Saudi Arabia's Public Investment Fund is looking to invest in Lucid Group.  

धन्यवाद!

 
jerry 2022-12-06

अगर crypto वर्ज़न बनाया जा सके तो अच्छा होगा। Crypto बाज़ार का समाचारों के साथ बहुत मज़बूत सकारात्मक सहसंबंध होता है।

 
nhjkjh0608 2022-10-31

वाह.. सच में बहुत बढ़िया सेवा है, धन्यवाद

 
qwerty9341 2022-10-31

इसी तरह के प्रोग्रामों में इसका user interface भी सुविधाजनक है और मुझे यह सबसे बेहतर लगा। मैंने Yahoo Finance, Dow Jones, Bloomberg आदि इस्तेमाल किए हैं (हालांकि मैं प्रोफेशनल नहीं, एक व्यक्तिगत निवेशक हूं, इसलिए अलग से प्रोग्राम तक इस्तेमाल नहीं किया), और इसमें संबंधित लेख देखना आसान लगता है। लेकिन हर व्यक्ति की अपनी रुचि के stocks होते हैं, इसलिए अकाउंट बनाना ज़रूरी न भी हो, तो भी अगर star mark करके किसी खास stock को लगातार track किया जा सके तो अच्छा होगा। मैं इसे अच्छे से इस्तेमाल करूंगा/करूंगी। धन्यवाद ^-^

 
1juice 2022-10-25

मैं एक securities company में वर्तमान में काम करता/करती हूँ। मैं इसे एक service के रूप में develop करना चाहता/चाहती हूँ..??
एक बात जाननी थी, अगर मैं आपको mail भेजूँ तो क्या आप जवाब देंगे??haha

 
eipi10 2022-10-25

नमस्ते! रुचि दिखाने के लिए धन्यवाद। अगर आपके कोई सवाल हों तो छोड़ दीजिए, मैं जवाब दूँगा! लेकिन, अगर उसमें कोई निजी बात शामिल नहीं है, तो यहाँ छोड़ना शायद बेहतर होगा ताकि उसे दूसरे लोग भी साथ में देख और साझा कर सकें! धन्यवाद।

 
1juice 2022-10-26

हाँ। मेरे मन में बहुत सारे सवाल हैं. :) मुझे तकनीकी बातें ज़्यादा नहीं पता, इसलिए आराम से एक बात पूछना चाहता/चाहती हूँ.

क्या इस प्रोजेक्ट की accuracy को थोड़ा और बढ़ाया जा सकता है?
मेरा अनुमान है कि दिशा कुछ ऐसी होगी—news की मात्रा बढ़ाना, news की quality बेहतर करना, या model की accuracy बढ़ाना.
अगर इसमें और ज़्यादा resources लगाए जाएँ, तो आपने जो service बनाई है उसकी accuracy को लगभग कितनी हद तक बढ़ाया जा सकता है, यह जानने की उत्सुकता है. haha

 
eipi10 2022-10-26

हाँ, मुझे लगता है कि इसे काफ़ी ज़्यादा बेहतर किया जा सकता है। मैंने यह व्यक्तिगत रूप से किया था, और क्योंकि (अभी तक) इससे कोई राजस्व नहीं है, इसलिए cost efficiency के पहलू पर काफ़ी ज़्यादा फोकस करते हुए अभी भी सुधार की बहुत गुंजाइश है।

जैसा आपने कहा, सबसे पहले high-quality data को और अधिक सुरक्षित करना सबसे महत्वपूर्ण होगा। मेरी जानकारी में news के मामले में ऐसे कई SaaS हैं जिन्होंने crawling करके data अच्छी तरह बनाया हुआ है, इसलिए अगर यह व्यक्तिगत स्तर के बजाय कोई project हो, तो उचित लागत पर बाहरी paid SaaS का उपयोग करके high-quality news articles इकट्ठा किए जा सकते हैं।
इसके बाद, अभी मैंने model के input और output के लिए preprocessing और postprocessing पर बहुत ज़्यादा ध्यान नहीं दिया है, लेकिन अगर model के results को देखते हुए बेहतर quality के outputs पाने के लिए इस पर ध्यान दिया जाए, तो user की नज़र से परिणाम काफ़ी बेहतर लगेंगे। (उदाहरण के लिए, अभी मैं कुछ छोटे जवाब, जिनका अर्थ थोड़ा कम लगता है, या ऐसे जवाब जो खाली जगह जैसे लगते हैं, उन्हें भी इसलिए छोड़ देता था क्योंकि data खुद कम था... और व्यक्तिगत तौर पर जब जिज्ञासा होती थी तो बस click करके देखना चाहता था। लेकिन अगर यह production level पर हो, तो इन चीज़ों को और अच्छी तरह व्यवस्थित करके कहीं बेहतर user experience दिया जा सकता है।)
अंत में, cost की समस्या की वजह से मैंने बहुत हल्का model सिर्फ़ एक बार इस्तेमाल किया था, लेकिन शायद कोई बड़ा model (जिसमें computation ज़्यादा लगे, लेकिन performance अपेक्षाकृत बेहतर हो) इस्तेमाल किया जा सकता है। और मैंने जो Question Answering approach अपनाई, उसके अलावा भी कई अलग तरीकों से अधिक उपयुक्त परिणाम पाए जा सकते हैं।

लिखते-लिखते यह लंबा हो गया, लेकिन उम्मीद है कि यह उन दूसरे लोगों के लिए भी मददगार होगा जिन्हें इसमें रुचि है। धन्यवाद!

 
1juice 2022-10-26

बहुत शानदार है। daebak;;

अगर accuracy को पर्याप्त रूप से बढ़ाया जा सके, तो इसे तुरंत एक वास्तविक product के रूप में लागू करने तक पर भी विचार किया जा सकता है।
(ऐसा भी लगता है कि इस service को देखने वालों की comment प्रतिक्रियाओं भर से ही Preto-Type(Protox, Prito) के रूप में validation लगभग पूरी हो चुकी है haha)

एक planner के रूप में, overseas stocks के क्षेत्र में जिन सुधार बिंदुओं पर मैं सोच रहा था, वे मोटे तौर पर दो थे।

एक था भौतिक या तकनीकी Pain Point
-जैसे कि शाम में trading करनी पड़ती है / currency exchange करना पड़ता है / 15 मिनट पहले का price दिखता है / bid-ask दिखाई नहीं देता / trading के लिए उपलब्ध देशों की संख्या बहुत कम है—ऐसे local और overseas market के भौतिक अंतर से पैदा होने वाली असुविधाओं को कैसे दूर किया जाए।
लेकिन फिलहाल इस हिस्से में काफी सुधार हो चुका है। capital की ताकत... seyo haha

हाल के दिनों में जिस क्षेत्र में मेरी रुचि थी, वह information और content से जुड़ा issue था।
पहली बात, English अच्छी होनी चाहिए; और English अच्छी होने पर भी overseas information खोजना मुश्किल है, ऊपर से जानकारी इतनी ज्यादा है कि क्या और कैसे ढूँढें, यह समझना कठिन है। समय नहीं है, देखने को बहुत कुछ है, निवेश कठिन है, और बताने वाला कोई नहीं...
इसलिए securities firms आम तौर पर content team बनाती हैं, या content बाहर से खरीदती हैं, या research coverage को overseas stocks तक बढ़ाती हैं—लेकिन अभी बहुत लंबा रास्ता तय करना बाकी है। और इसमें एक-एक जगह इंसानी हाथ लगाना भी पड़ता है। इसलिए timeliness भी कम हो जाती है..

यही वजह थी कि आपके द्वारा बनाई गई service ने मुझे बहुत प्रभावित किया।
लगता है यह service रोज़मर्रा के user experience को काफी बेहतर बना सकती है। आखिरकार लोग जानना यही तो चाहते हैं—क्यों बढ़ा? क्यों गिरा?.. ऐसा ही न? haha

 
eipi10 2022-10-27

विस्तृत जवाब के लिए धन्यवाद! यह बहुत मददगार लगेगा। खासकर, क्योंकि आपने इस क्षेत्र में काम कर रहे व्यक्ति के तौर पर अपनी insight साझा की है, इससे सिर्फ मुझे ही नहीं बल्कि दूसरे लोगों को भी बहुत मदद मिलेगी। धन्यवाद!! haha

 
xguru 2022-10-26

प्रोजेक्ट और कमेंट—दोनों के लिए धन्यवाद। लगता है यह दूसरे लोगों के लिए भी बहुत मददगार होगा!

 
jhbaek 2022-10-25

बहुत शानदार सेवा है!
कई बार ऐसा भी होता है कि स्टॉक upper limit तक चला गया हो, लेकिन वजह ठीक से नहीं दी होती और सिर्फ यही खबर होती है कि upper limit लगा है.. ऐसे में इस तरह की खबरों को अच्छी तरह filter कैसे किया जा सकता है, यह जानने की जिज्ञासा है

 
eipi10 2022-10-25

नमस्ते! रुचि दिखाने के लिए धन्यवाद। मुझे लगता है कि गुणवत्ता कम होने के मुख्य रूप से दो कारण हो सकते हैं। एक यह कि मूल लेख में ही वह सामग्री पर्याप्त रूप से नहीं होती जो लोग चाहते हैं, और दूसरा यह कि machine learning model का inference परिणाम अच्छा नहीं होता। (फिलहाल यह काफ़ी naive तरीके से काम कर रहा है haha..)

अभी जब कई लेख होते हैं, तो sorting model output score से की जाती है। लेकिन बहुत छोटे वाक्य (जैसे अभी दिख रहे उदाहरण में पूरी तरह खाली या बहुत छोटे) को फ़िल्टर करना, या कुछ अतिरिक्त heuristics इस्तेमाल करना, इससे इसे जल्दी बेहतर बनाया जा सकता है। उपयोगी feedback के लिए धन्यवाद!

 
xguru 2022-10-24

वाह, यह बहुत अच्छा है.
मुझे लगता है कि अगर कुछ मनचाहे stocks को subscribe करके हर सुबह email में प्राप्त किया जा सके तो अच्छा होगा.
क्योंकि email में लागत आती है, इसलिए आप कम कीमत वाले किसी paid model पर भी विचार कर सकते हैं haha

 
eipi10 2022-10-24

अच्छी राय और आइडियाज़ के लिए धन्यवाद! haha मैं धीरे-धीरे फीचर्स जोड़कर देखूंगा। मुझे GeekNews से हमेशा बहुत प्रेरणा मिलती रही है, इसलिए इस मौके पर मैं दिल से कहना चाहता हूँ कि मैं बहुत आभारी हूँ! haha

 
lux1024 2022-10-24

जानना दिलचस्प होगा कि Korean stocks के लिए क्या आएगा, haha

 
eipi10 2022-10-24

मैं वैसे भी कोरियाई stocks को लेकर सोच रहा था, इसलिए इसे थोड़ा-थोड़ा develop करके जोड़ने की कोशिश करूंगा। दिलचस्पी दिखाने के लिए धन्यवाद haha

 
ambler 2022-10-23

वाह! यह काफ़ी दिलचस्प सेवा लगती है। यह सोचकर अच्छा लग रहा है कि क्या इसी तरीके से music chart में किसी खास artist के गाने के अचानक दोबारा लोकप्रिय होने पर भी analysis किया जा सकता है।

 
eipi10 2022-10-24

अच्छे सुझाव के लिए धन्यवाद! इसी तरह के approach में, अगर data पर्याप्त हो तो सच में ऐसी बहुत-सी चीज़ें हो सकती हैं जिनका उपयोग किया जा सकता है!

 
bus710 2022-10-23

स्टॉक्स... कभी-कभी ऊपर भी जाते हैं...? अजीब है... मेरे वाले तो बस गिरते ही रहे...

 
roxie 2022-10-23

नई स्टॉक खरीदने से पहले कृपया इसे GeekNews पर साझा करें