3 पॉइंट द्वारा hcmhcs0 2026-03-16 | 2 टिप्पणियां | WhatsApp पर शेयर करें

नमस्ते, मैं एक छात्र डेवलपर हूँ!

इन दिनों मेरी रुचि AI एजेंट्स की तरफ बढ़ी, इसलिए मैं OpenClaw पर अपलोड किए गए system prompts और निर्देशों को खोल-खोलकर पढ़ते हुए सीख रहा था। मुझे जिज्ञासा थी कि एजेंट्स सिर्फ LLM की साधारण reasoning से कहीं बेहतर नतीजे क्यों देते हैं, और वे किस तरह के system prompts और संरचना से बने होते हैं। (मैं अपनी परिस्थिति के हिसाब से एक AI एजेंट बनाकर productivity बढ़ाना चाहता था, हाहा।) लेकिन VS Code में कोड के भीतर मौजूद system prompts सब अंग्रेज़ी में थे, और संबंधित दस्तावेज़ भी लगभग सभी अंग्रेज़ी में थे। इसलिए translator tab खोलकर बार-बार आना-जाना, copy-paste करना और पढ़ना पड़ रहा था, जिससे context बार-बार टूट जाता था और ध्यान लगाना मुश्किल हो रहा था। और जब सामग्री image या PDF जैसी हो, जहाँ text copy भी नहीं किया जा सकता, तो और भी ज़्यादा असुविधा होती थी।

फिर मैं अपने पसंदीदा ScreenHint ऐप को देख रहा था, जो स्क्रीन पर capture को pin करके रखने देता है, और तब मुझे लगा, "अगर इसी UX में capture किए गए हिस्से का तुरंत अनुवाद कर दिया जाए, तो बढ़िया होगा।" एक छात्र होने के नाते हर बार translation API पर पैसे खर्च करना भी बोझ था, इसलिए मैंने on-device को ही मूल आधार रखा। संयोग से Claude Code की मदद से मैं इस आइडिया को जल्दी implement कर पाया, और इस तरह यह मेरा पहला open source प्रोजेक्ट बन गया।

ScreenTranslate — यह एक macOS ऐप है जिसमें स्क्रीन कैप्चर करते ही OCR → translation तुरंत हो जाता है। यह मेन्यू बार में चलता रहता है और shortcut key से तुरंत इस्तेमाल किया जा सकता है।

मुख्य रूप से इसमें दो फीचर हैं:

  1. स्क्रीन कैप्चर translation — shortcut key → क्षेत्र drag करें → OCR से पहचान → translation popup
  2. text translation — text चुनें → shortcut key → तुरंत translation (OCR के बिना)

यह मुफ़्त है और open source (GPL v3) है। यह on-device चलता है, इसलिए translation data का एक भी हिस्सा server पर नहीं जाता।

विशेषताएँ:

  • Apple Vision OCR + Apple Translation पर आधारित, इंटरनेट के बिना काम करता है
  • DeepL के default app की तुलना में महसूस होने वाली गति काफ़ी तेज़ है। कैप्चर से translation popup तक लगभग 1 सेकंड
  • अगर cloud engine चाहिए, तो DeepL, Google Cloud, Azure को BYOK (API key सीधे दर्ज करें) के साथ इस्तेमाल किया जा सकता है
  • translation history सेव करना, clipboard में अपने-आप copy करना
  • 20 भाषाओं का समर्थन

टेक स्टैक:

  • macOS 15+ / Swift 6 / SwiftUI / SwiftData
  • आंतरिक प्रवाह: Vision(VNRecognizeTextRequest) → line break preprocessing → Translation or API → popup
  • कोई external dependency नहीं। केवल Apple native frameworks का उपयोग (आवश्यकता: macos 15+ या उससे ऊपर - Apple Silicon/Intel दोनों संभव)

GitHub: https://github.com/hcmhcs/screenTranslate
डेमो वीडियो: https://www.youtube.com/watch?v=ItYNAyue7eo
डाउनलोड: GitHub Releases से DMG लें, या सीधे build कर सकते हैं (README.md फ़ाइल देखें)

शुरुआत में इसे मैंने सिर्फ अपने इस्तेमाल के लिए हल्के तौर पर बनाया था, इसलिए थोड़ा संकोच भी होता है। लेकिन मुझे लगता है कि यह काफ़ी अच्छा बनकर निकला है, इसलिए मैंने पहली बार इसे Product Hunt पर भी लॉन्च किया। अब मैं वास्तविक उपयोगकर्ताओं से feedback लेकर और updates जारी करते हुए इसे बेहतर बनाने की प्रक्रिया से गुज़र रहा हूँ!
यह मेरा पहला solo open source प्रोजेक्ट है, इसलिए इसमें कई कमियाँ हो सकती हैं। अगर आप feedback या PR भेजें तो मैं आभारी रहूँगा :)

2 टिप्पणियां

 
guarder 2026-03-24

मैं इसका बहुत अच्छी तरह से उपयोग कर रहा हूँ!

 
hcmhcs0 2026-03-24

गर्मजोशी भरी टिप्पणी के लिए धन्यवाद! मैं भी इन दिनों usability बेहतर बनाने के लिए इसे लगातार तरह-तरह से refine कर रहा हूँ, और यह सुनना कि आप इसे अच्छी तरह इस्तेमाल कर रहे हैं, मेरे लिए सच में बहुत बड़ी प्रेरणा है। हाहा, अगर इस्तेमाल करते समय कोई असुविधा हो, तो कभी भी बेझिझक बताइए :)