कोरियाई शेयर बाज़ार समाचार विश्लेषण और निवेश रिसर्च के लिए विशेषीकृत 7B पैरामीटर एजेंट LLM
(huggingface.co)कोरियाई स्टॉक मार्केट (KOSPI+KOSDAQ) के लिए विशेषीकृत भाषा मॉडल VELA पेश किया गया है.
इसे Qwen2.5-7B-Instruct को आधार बनाकर SFT + DPO पाइपलाइन से fine-tune किया गया है.
इसे बनाने का कारण
मौजूदा वित्तीय LLM में कोरियाई बाज़ार की शब्दावली के मामले में hallucination बहुत ज़्यादा था,
या जवाब के बीच में Chinese/English में बदल जाने वाली language leak समस्या थी.
VELA ने इन दोनों समस्याओं को DPO के जरिए केंद्रित रूप से ठीक किया है.
ट्रेनिंग डेटा
- SFT: 36,713 samples / 2,135 stocks (news classification, sharp rise/fall signals, securities firm reports, tool calling, sector/macro analysis आदि)
- DPO: 24,779 pairs (Chinese·English leak हटाना, Reasoning Trace फ़ॉर्मैट alignment)
आउटपुट फ़ॉर्मैट
- Reasoning Trace – JSON फ़ॉर्मैट में step-by-step reasoning process (search → analyze → confidence)
- Synthesis Report – 7-section research report (summary, indicators, fund flow, news impact, risk, investment opinion)
परफ़ॉर्मेंस (RTX 3060 12GB मानक)
| फ़ॉर्मैट | गति | क्षमता | Chinese Leak |
|---|---|---|---|
| Q4_K_M | 36 tok/s | 4.4GB | 0/5 CLEAN |
| Q8_0 | 25 tok/s | 7.6GB | 0/5 CLEAN |
ध्यान दें: वास्तविक उपयोग में आपको मॉडल को सही news sources और data उपलब्ध कराना होगा. सटीक source न होने पर hallucination हो सकता है. इसे https://github.com/unohee/vela-framework के साथ उपयोग के लिए डिज़ाइन किया गया है.
समर्थित इंटरफ़ेस
llama-cpp-python / Ollama / vLLM / Transformers / MLX
लाइसेंस: Apache 2.0
🤗 https://huggingface.co/intrect/VELA
रियल-टाइम price data बाहरी API से दिया जाता है, और VELA को उसके ऊपर inference layer के रूप में डिज़ाइन किया गया है.
यह निवेश सलाह नहीं, बल्कि जानकारी प्रदान करने के उद्देश्य से है.
3 टिप्पणियां
कमाल है ^^
कमाल है! क्या 7B के साथ भी यह स्थिर है?
मॉडल के साइज़ की तुलना में, बुनियादी कामों में यह base मॉडल से स्पष्ट रूप से बेहतर है। लगता है benchmark भी साथ में अपलोड करना चाहिए!