यह rust/slint से बना Windows के लिए OCR अनुवादक है.
यह VLM-आधारित है और gemini तथा लोकल मॉडल्स को सपोर्ट करता है. (LM Studio, OpenAI compatible API आदि)
यह hotkey, overlay, text box, auto re-translation, clipboard, prompt बदलाव, style फीचर आदि जैसी कई सुविधाओं को सपोर्ट करता है.
text box मोड में अनुवाद हो रही स्क्रीन के भीतर क्लिक करना भी संभव है.
यह गेम अनुवाद के लिए अच्छा है.

लोकल मॉडल्स में gemma-4-31b-it की गुणवत्ता सबसे अच्छी है और gemma-4-26b-a4b गति/गुणवत्ता संतुलन के लिए अच्छा है.
qwen3.5 9 तेज है, लेकिन कुछ कमी महसूस होती है.

system prompt के अनुसार भी थोड़ा अंतर दिखाई देता है.
आप translation style के लिए निर्देश दे सकते हैं, और proper noun जैसी चीज़ें system prompt में सीधे दर्ज करने पर यह उन्हें अच्छी तरह संभालता है.
system prompt बदलने पर यह सिर्फ अनुवाद ही नहीं, और भी काम कर सकता है.
(markdown, json बनाना, सारांश, manga को novel में बदलना, टेक्स्ट की स्थिति आउटपुट करना, चित्र विवरण, prompt जनरेशन, वेबपेज डिज़ाइन मूल्यांकन आदि)
इसके उपयोग के तरीके लगभग असीमित हैं.

विस्तृत उपयोग विधि के लिए GitHub देखें.
https://github.com/kirinonakar/ocr_trans

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.