8 पॉइंट द्वारा unohee 2026-03-31 | 3 टिप्पणियां | WhatsApp पर शेयर करें

कोरियाई स्टॉक मार्केट (KOSPI+KOSDAQ) के लिए विशेषीकृत भाषा मॉडल VELA पेश किया गया है.

इसे Qwen2.5-7B-Instruct को आधार बनाकर SFT + DPO पाइपलाइन से fine-tune किया गया है.

इसे बनाने का कारण
मौजूदा वित्तीय LLM में कोरियाई बाज़ार की शब्दावली के मामले में hallucination बहुत ज़्यादा था,
या जवाब के बीच में Chinese/English में बदल जाने वाली language leak समस्या थी.
VELA ने इन दोनों समस्याओं को DPO के जरिए केंद्रित रूप से ठीक किया है.

ट्रेनिंग डेटा

  • SFT: 36,713 samples / 2,135 stocks (news classification, sharp rise/fall signals, securities firm reports, tool calling, sector/macro analysis आदि)
  • DPO: 24,779 pairs (Chinese·English leak हटाना, Reasoning Trace फ़ॉर्मैट alignment)

आउटपुट फ़ॉर्मैट

  1. Reasoning Trace – JSON फ़ॉर्मैट में step-by-step reasoning process (search → analyze → confidence)
  2. Synthesis Report – 7-section research report (summary, indicators, fund flow, news impact, risk, investment opinion)

परफ़ॉर्मेंस (RTX 3060 12GB मानक)

फ़ॉर्मैट गति क्षमता Chinese Leak
Q4_K_M 36 tok/s 4.4GB 0/5 CLEAN
Q8_0 25 tok/s 7.6GB 0/5 CLEAN

ध्यान दें: वास्तविक उपयोग में आपको मॉडल को सही news sources और data उपलब्ध कराना होगा. सटीक source न होने पर hallucination हो सकता है. इसे https://github.com/unohee/vela-framework के साथ उपयोग के लिए डिज़ाइन किया गया है.

समर्थित इंटरफ़ेस
llama-cpp-python / Ollama / vLLM / Transformers / MLX

लाइसेंस: Apache 2.0

🤗 https://huggingface.co/intrect/VELA

रियल-टाइम price data बाहरी API से दिया जाता है, और VELA को उसके ऊपर inference layer के रूप में डिज़ाइन किया गया है.
यह निवेश सलाह नहीं, बल्कि जानकारी प्रदान करने के उद्देश्य से है.

3 टिप्पणियां

 
310writer 2026-04-06

कमाल है ^^

 
ahiou 2026-04-01

कमाल है! क्या 7B के साथ भी यह स्थिर है?

 
unohee 2026-04-01

मॉडल के साइज़ की तुलना में, बुनियादी कामों में यह base मॉडल से स्पष्ट रूप से बेहतर है। लगता है benchmark भी साथ में अपलोड करना चाहिए!