• macOS पर Control key दबाकर बोलने पर अपने-आप टेक्स्ट में बदलकर paste करने वाला लोकल speech recognition ऐप
  • सभी speech recognition और text cleanup प्रक्रियाएँ सिर्फ लोकल में चलती हैं, इसलिए cloud ट्रांसमिशन के बिना privacy सुरक्षा सुनिश्चित होती है
  • WhisperKit और LLM.swift पर आधारित, Hugging Face models को अपने-आप डाउनलोड करके cache में सेव करता है
  • smart cleanup फीचर से अनावश्यक शब्द हटते हैं और self-correction अभिव्यक्तियों को सुधारा जाता है, menu bar ऐप के रूप में बैकग्राउंड में चलता है
  • MIT license open source के रूप में उपलब्ध है और Apple Silicon macOS 14 या उससे ऊपर पर चलता है

अवलोकन

  • Ghost Pepper macOS के लिए एक पूरी तरह लोकल speech-to-text कन्वर्ज़न ऐप है, जो Control key दबाकर बोलने और छोड़ते ही अपने-आप टेक्स्ट में बदलकर paste करने की सुविधा देता है
  • यह cloud API का उपयोग नहीं करता, और सभी डेटा व models सिर्फ लोकल में प्रोसेस होते हैं
  • Apple Silicon(M1 या उससे ऊपर) आधारित macOS 14.0 या उससे ऊपर पर चलता है
  • यह menu bar ऐप के रूप में चलता है और login पर अपने-आप शुरू किया जा सकता है
  • MIT license के तहत जारी एक open source प्रोजेक्ट है

मुख्य फीचर्स

  • Control key दबाकर बोलें → key छोड़ते ही अपने-आप text conversion और paste
  • लोकल execution structure की वजह से speech recognition और post-processing models दोनों Mac के अंदर ही चलते हैं
  • smart cleanup फीचर अनावश्यक शब्दों (uh, um आदि) को हटाता है और self-correction अभिव्यक्तियों को अपने-आप सुधारता है
  • menu bar-only interface के साथ Dock icon के बिना बैकग्राउंड में काम करता है
  • user settings support: cleanup prompt बदलना, mic चुनना, फीचर on/off करना संभव

काम करने का तरीका

  • सभी models open source आधारित हैं और पहली बार चलाने पर अपने-आप डाउनलोड होकर लोकल cache में सेव हो जाते हैं
  • speech recognition WhisperKit से और text cleanup LLM.swift के जरिए किया जाता है
  • model files Hugging Face से उपलब्ध कराई जाती हैं
  • speech recognition models

    • Whisper tiny.en (~75MB): सबसे तेज़ English-only model
    • Whisper small.en (~466MB): डिफॉल्ट, उच्च accuracy वाला English-only model
    • Whisper small (multilingual): बहुभाषी support
    • Parakeet v3 (~1.4GB): 25 भाषाओं का support, FluidAudio आधारित
  • text cleanup models

    • Qwen 3.5 0.8B (~535MB): डिफॉल्ट, लगभग 1~2 सेकंड में प्रोसेसिंग
    • Qwen 3.5 2B (~1.3GB): तेज़ प्रोसेसिंग स्पीड (लगभग 4~5 सेकंड)
    • Qwen 3.5 4B (~2.8GB): सर्वोत्तम quality (लगभग 5~7 सेकंड)

इंस्टॉलेशन और रन

  • ऐप इंस्टॉलेशन

    1. GhostPepper.dmg डाउनलोड करें
    2. DMG खोलने के बाद Applications folder में drag करें
    3. Microphone और Accessibility permissions की अनुमति दें
    4. Control key दबाकर बोलें और उपयोग शुरू करें
  • source build

    1. repository clone करें
    2. GhostPepper.xcodeproj को Xcode में खोलें
    3. Cmd+R से build और run करें

permission आवश्यकताएँ

permission उद्देश्य
Microphone आवाज़ रिकॉर्ड करना
Accessibility global shortcut और auto-paste चलाना

अतिरिक्त जानकारी

  • login पर अपने-आप चलना डिफॉल्ट रूप से सक्षम है, और settings में इसे बंद किया जा सकता है
  • disk पर कोई logs सेव नहीं होते — बदला गया टेक्स्ट file में रिकॉर्ड नहीं होता, और debug logs केवल memory में रखे जाते हैं और ऐप बंद होने पर हटा दिए जाते हैं

तकनीकी संरचना और dependencies

  • WhisperKit: speech recognition engine
  • LLM.swift: text cleanup के लिए लोकल LLM
  • Hugging Face: model hosting
  • Sparkle: macOS ऐप update management

नाम का अर्थ

  • सभी models सिर्फ लोकल में चलते हैं, इसलिए व्यक्तिगत डेटा बाहर नहीं भेजा जाता
  • Ghost Pepper(तीखी मिर्च) नाम मुफ़्त में मिलने वाली शक्तिशाली क्षमताओं का प्रतीक है

एंटरप्राइज़ और managed devices support

  • ऐप को Accessibility permission चाहिए, जिसके लिए आमतौर पर admin permission की आवश्यकता होती है
  • MDM environments(Jamf, Kandji, Mosaic आदि) में PPPC(Privacy Preferences Policy Control) profile के जरिए पहले से अनुमति दी जा सकती है
    • Bundle ID: com.github.matthartman.ghostpepper
    • Team ID: BBVMGXR9AY
    • Permission: Accessibility (com.apple.security.accessibility)

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.