AI निवेश में, क्या सबकी दिलचस्पी नहीं है?

X या Threads को देखें तो AI के साथ निवेश करने के अनुभव साझा करने वाली पोस्ट्स सचमुच बहुत हैं। कोडिंग एजेंट से कहें तो वह निवेश रणनीति भी झटपट बना देता है, और उसे चला कर देख भी सकता है। शायद शुरुआत में ज्यादातर लोग AI से यह पूछने से शुरू करेंगे कि कौन-से स्टॉक्स चुनने चाहिए।

लेकिन इस तरीके की एक संरचनात्मक सीमा है। AI के निर्णय पर आधारित निवेश को वैज्ञानिक रूप से वैलिडेट करना मुश्किल है। AI पहले से ही historical data सीख चुका होता है, इसलिए अगर आप उससे कहें, "मार्च 2020 के समय की खबरें देखकर स्टॉक्स चुनो," तो उसका खास मतलब नहीं रह जाता — क्योंकि उसे नतीजा पहले से पता है। आखिरकार इसे live में चलाकर actual returns ट्रैक करने के अलावा कोई रास्ता नहीं बचता, और पहले से रिटर्न का अंदाज़ा लगाने का तरीका नहीं होता।

यह समझ में आते ही स्वाभाविक रूप से रुचि quant तरीके की ओर जाती है — factor-based screening, data-based backtesting। अगर निवेश को गंभीरता से व्यवस्थित करना हो, तो मुझे लगता है कि यही सही तरीका है।

लेकिन डेटा उम्मीद से ज्यादा मुश्किल है

Quant निवेश करने के लिए डेटा चाहिए। Korean market के daily bars, financial statements, और supply-demand data का 10 साल से ज्यादा का इतिहास होना चाहिए, तभी backtest का मतलब बनता है। हाँ, कोडिंग एजेंट से कहें तो वह data collection भी कर देता है। लेकिन free में one-time data लाना सोच से ज्यादा सीमित होता है। API call limits, data consistency, delisted stocks की handling जैसी चीज़ों को ध्यान में रखें तो इसमें काफी मेहनत लगती है।

उसके ऊपर backtest engine, scheduled jobs से रोज़ चलाना, alerts, और आगे चलकर automated trading तक जोड़ना हो तो काम काफी बढ़ जाता है।

इसीलिए यह environment पहले से बनाकर, इसे natural language में आसानी से इस्तेमाल किया जा सके ऐसा जो बनाया, वही FoldAlpha है।

इससे आप ये काम कर सकते हैं

  • Natural language backtesting: अगर आप "PBR 0.5 या उससे कम, operating margin 10% या उससे ज्यादा वाले स्टॉक्स में quarterly rebalancing" जैसी रणनीति natural language में define करते हैं, तो एजेंट उसे SQL में बदलकर 10 साल का backtest चलाता है। CAGR, MDD, Sharpe Ratio, और KOSPI के मुकाबले excess return तक अपने आप calculate हो जाते हैं।
  • Scheduled jobs + Telegram alerts: अगर आप "हर सुबह 9 बजे संभावित तेज़ी वाले स्टॉक्स का विश्लेषण करो" जैसी शर्त register करते हैं, तो यह रोज़ अपने आप execute होता है और नतीजे Telegram पर भेज देता है।
  • Financial data Q&A: आप natural language में financial statements, stock prices, और supply-demand data को query और analyze कर सकते हैं।

मैं खुद भी इसी डेटा के आधार पर Korea और US market में monthly और quarterly stock selection तथा rebalancing करते हुए वास्तविक निवेश कर रहा हूँ। यह नहीं कहूँगा कि returns बहुत शानदार हैं, लेकिन मुझे लगता है कि किसी individual investor के लिए यह सबसे logical और objective तरीका है।

AI-recommended investing भी बिल्कुल संभव है

News, earnings reports, "HBM value chain beneficiaries", "Trump tariff beneficiaries" — आसपास लगभग सभी लोग ऐसे ही निवेश करते हैं।

यह भी स्वाभाविक रूप से किया जा सकता है। अगर scheduled job में "हर दिन आज के संभावित तेज़ी वाले स्टॉक्स का news-based analysis करो" register कर दें, तो एजेंट real-time news खोजकर उसका analysis करेगा, रोज़ recommendations देगा, और अगले दिन यह भी ट्रैक किया जा सकता है कि वे वास्तव में बढ़े या नहीं। मैं अभी इस scenario को live में चलाकर results इकट्ठा कर रहा हूँ।

फिलहाल live recommendation results को थोड़ा और observe करने के बाद, अगला कदम इसे automated trading से जोड़ना मान रहा हूँ। Korea Investment & Securities API के हिसाब से initial setup थोड़ा complex है, लेकिन key registration हो जाए तो actual trade placement उतना मुश्किल नहीं लगता।

News-based strategy investing को भी अगर वैज्ञानिक तरीके से करना है, तो news archive बनाना ज़रूरी है। लेकिन historical news को retroactively collect करना शायद Bloomberg के लिए भी आसान काम नहीं होगा। इसे long term में हल करने का इरादा है।

इसे कैसे बनाया

बिल्कुल, इसे vibe coding से बनाया गया है। Claude Code, Codex, और Cursor को अलग-अलग तरह से इस्तेमाल कर रहा हूँ। लेकिन vibe coding से सब कुछ बन जाना कोई "एक-क्लिक" काम नहीं है। खासकर LLM agent runtime — यानी harness बनाने वाला हिस्सा — काफी गहराई में जाकर करना पड़ा।

शुरुआत में vibe coding ने जो agent बनाया था, वह intent classifier + 9 tools वाली एक complex pipeline थी, लेकिन latency धीमी थी और वह scale नहीं हो पा रही थी। हाल ही में जारी हुए Claude Code और Codex CLI जैसे coding agents की architecture का analysis करके, मैंने इसे single-loop lightweight structure में फिर से design किया, जिसमें LLM हर step पर सीधे निर्णय लेता है। इससे latency 2 गुना से भी ज्यादा कम हो गई। इस प्रक्रिया को मैंने technical report के रूप में लिखा है, और runtime code भी open source के रूप में जारी किया है।

Tech stack:

  • फ्रंटएंड: Next.js (Vercel)
  • बैकएंड: Fastify (Node.js)
  • LLM agent runtime: Python, custom implementation — single-loop agent pattern
  • स्टॉक डेटा DB: Oracle Autonomous DB (Korean market daily bars, financials, supply-demand data का 10 साल का इतिहास)
  • यूज़र डेटा: Supabase (PostgreSQL)
  • News search: Brave Search API
  • LLM: Gemini / GPT / Claude (BYOK — यूज़र अपनी API key इस्तेमाल करते हैं)

इंफ्रास्ट्रक्चर: सब कुछ free tier पर

  • Vercel: फ्रंटएंड होस्टिंग
  • Supabase: यूज़र DB + authentication
  • Oracle ADB: स्टॉक डेटा DB (Always Free)
  • Oracle Cloud: 1 VM instance — production और development server दोनों यहीं चल रहे हैं
  • Cloudflare: domain + CDN

एकमात्र खर्च domain खरीदने का है। production और development को एक ही instance पर सिर्फ ports अलग करके चला रहा हूँ।

लिंक

फ़ीडबैक का स्वागत है।

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.