आधिकारिक दस्तावेज़ अनुवाद वर्कफ़्लो का विकास – Spring & MySQL आधिकारिक दस्तावेज़ों का अनुवाद और खोज

(devrunner.dev)

4 पॉइंट द्वारा dankim0124 2026-01-25 | 2 टिप्पणियां | WhatsApp पर शेयर करें

परिचय

नमस्ते।

इस बार मैंने आधिकारिक दस्तावेज़ सीरीज़ का अनुवाद करने के लिए एक वर्कफ़्लो बनाया है, और Mysql तथा Spring boot के अनुवादित परिणामों को खोजे जा सकने वाले रूप में सार्वजनिक किया है.

मैं इंटरव्यू के पहले और बाद में अक्सर आधिकारिक दस्तावेज़ों को सरसरी तौर पर देखता हूँ, इसलिए उम्मीद है कि समान उपयोग के लिए इसे इस्तेमाल करने वाले लोगों के लिए भी यह मददगार होगा.

वास्तविक prompts, service links, और इस बार 5.1 का उपयोग करते समय जिन OpenAI ब्लॉग पोस्टों का मैंने संदर्भ लिया, उन्हें नीचे दिए गए लिंक संग्रह में रखा है.

GPT-5.1 के बाद, LLM reasoning performance का अनुभव

GPT-3.5 के समय से अनुवाद automation की कोशिश करते हुए जो प्रदर्शन अंतर मैंने महसूस किया, उसे यहाँ दर्ज कर रहा हूँ.

GPT-3.5 के मानक पर, लगभग 5,000~10,000 अक्षरों जैसे अपेक्षाकृत छोटे टेक्स्ट में भी Markdown फ़ॉर्मैट सुधार जैसे छोटे काम अक्सर अच्छी क्वालिटी के साथ नहीं हो पाते थे.

वहीं GPT-5.1 में नीचे जैसे काम अपेक्षाकृत स्थिर रूप से किए जा सके.

1 लाख से अधिक अक्षरों वाले HTML से 1,000 से अधिक TOC जानकारी (6 कॉलम) को क्रम बनाए रखते हुए स्थिर रूप से निकालना
किन terms को English में रखना है और किन्हें अनुवाद करना है, इसका निर्णय LLM पर छोड़ने पर भी अच्छी पठनीयता वाला दस्तावेज़ लौटता है (उदाहरण: Spring दस्तावेज़ में bean को English में रखना, factory को हिंदी में लिखना)

काम के दौरान यदि कुछ टूटता था या पूरकता की ज़रूरत होती थी, तो system prompt में नियम जोड़ने के तरीके से उसका समाधान किया गया, और
system prompt लंबा होने पर भी परिणाम की गुणवत्ता बहुत अधिक नहीं डगमगाती थी — यह वह बात थी जिसकी पुराने मॉडलों से उम्मीद करना कठिन था.

लिंक संग्रह

नीचे इस काम से संबंधित संदर्भ सामग्री को व्यवस्थित किया गया है.

यह साझा कर रहा हूँ क्योंकि मुझे लगा कि इतने heavy prompt requests में भी मौजूदा service स्तर के परिणाम निकल सकते हैं, इसे दिखाने वाले संदर्भ के रूप में इसका महत्व है.

(मुझे नहीं लगता कि prompt स्वयं बहुत अच्छी तरह लिखा गया है हह, इस तरह के prompt tips anthropic और openai ब्लॉग पर बहुत हैं, इसलिए उनमें से एक प्रतिनिधि उदाहरण जोड़ रहा हूँ)

2 टिप्पणियां

ng0301 2026-01-26

लगता है कि search results में documents की संख्या हमेशा 0 ही रहती है।

dankim0124 2026-01-26

अरे! जानकारी देने के लिए धन्यवाद।
मेरे यहाँ अभी यह ठीक से दिख रहा है। फिर भी एहतियात के तौर पर मैंने deployment एक बार फिर से चेक कर लिया है.

फिर भी ताकि मैं इसकी जाँच कर सकूँ, अगर आप बता दें कि आपने कौन-सा search term इस्तेमाल किया था, तो आभारी रहूँगा।
अभी इसमें Korean <-> English के लिए synonym dictionary नहीं है, इसलिए हो सकता है कि exact match न होने की वजह से यह दिखाई नहीं दिया हो.