आधिकारिक दस्तावेज़ अनुवाद वर्कफ़्लो का विकास – Spring & MySQL आधिकारिक दस्तावेज़ों का अनुवाद और खोज
(devrunner.dev)परिचय
नमस्ते।
इस बार मैंने आधिकारिक दस्तावेज़ सीरीज़ का अनुवाद करने के लिए एक वर्कफ़्लो बनाया है, और Mysql तथा Spring boot के अनुवादित परिणामों को खोजे जा सकने वाले रूप में सार्वजनिक किया है.
मैं इंटरव्यू के पहले और बाद में अक्सर आधिकारिक दस्तावेज़ों को सरसरी तौर पर देखता हूँ, इसलिए उम्मीद है कि समान उपयोग के लिए इसे इस्तेमाल करने वाले लोगों के लिए भी यह मददगार होगा.
वास्तविक prompts, service links, और इस बार 5.1 का उपयोग करते समय जिन OpenAI ब्लॉग पोस्टों का मैंने संदर्भ लिया, उन्हें नीचे दिए गए लिंक संग्रह में रखा है.
GPT-5.1 के बाद, LLM reasoning performance का अनुभव
GPT-3.5 के समय से अनुवाद automation की कोशिश करते हुए जो प्रदर्शन अंतर मैंने महसूस किया, उसे यहाँ दर्ज कर रहा हूँ.
GPT-3.5 के मानक पर, लगभग 5,000~10,000 अक्षरों जैसे अपेक्षाकृत छोटे टेक्स्ट में भी Markdown फ़ॉर्मैट सुधार जैसे छोटे काम अक्सर अच्छी क्वालिटी के साथ नहीं हो पाते थे.
वहीं GPT-5.1 में नीचे जैसे काम अपेक्षाकृत स्थिर रूप से किए जा सके.
- 1 लाख से अधिक अक्षरों वाले HTML से 1,000 से अधिक TOC जानकारी (6 कॉलम) को क्रम बनाए रखते हुए स्थिर रूप से निकालना
- किन terms को English में रखना है और किन्हें अनुवाद करना है, इसका निर्णय LLM पर छोड़ने पर भी अच्छी पठनीयता वाला दस्तावेज़ लौटता है (उदाहरण: Spring दस्तावेज़ में bean को English में रखना, factory को हिंदी में लिखना)
काम के दौरान यदि कुछ टूटता था या पूरकता की ज़रूरत होती थी, तो system prompt में नियम जोड़ने के तरीके से उसका समाधान किया गया, और
system prompt लंबा होने पर भी परिणाम की गुणवत्ता बहुत अधिक नहीं डगमगाती थी — यह वह बात थी जिसकी पुराने मॉडलों से उम्मीद करना कठिन था.
लिंक संग्रह
नीचे इस काम से संबंधित संदर्भ सामग्री को व्यवस्थित किया गया है.
यह साझा कर रहा हूँ क्योंकि मुझे लगा कि इतने heavy prompt requests में भी मौजूदा service स्तर के परिणाम निकल सकते हैं, इसे दिखाने वाले संदर्भ के रूप में इसका महत्व है.
(मुझे नहीं लगता कि prompt स्वयं बहुत अच्छी तरह लिखा गया है हह, इस तरह के prompt tips anthropic और openai ब्लॉग पर बहुत हैं, इसलिए उनमें से एक प्रतिनिधि उदाहरण जोड़ रहा हूँ)
2 टिप्पणियां
लगता है कि search results में documents की संख्या हमेशा 0 ही रहती है।
अरे! जानकारी देने के लिए धन्यवाद।
मेरे यहाँ अभी यह ठीक से दिख रहा है। फिर भी एहतियात के तौर पर मैंने deployment एक बार फिर से चेक कर लिया है.
फिर भी ताकि मैं इसकी जाँच कर सकूँ, अगर आप बता दें कि आपने कौन-सा search term इस्तेमाल किया था, तो आभारी रहूँगा।
अभी इसमें Korean <-> English के लिए synonym dictionary नहीं है, इसलिए हो सकता है कि exact match न होने की वजह से यह दिखाई नहीं दिया हो.