- macOS पर Control key दबाकर बोलने पर अपने-आप टेक्स्ट में बदलकर paste करने वाला लोकल speech recognition ऐप
- सभी speech recognition और text cleanup प्रक्रियाएँ सिर्फ लोकल में चलती हैं, इसलिए cloud ट्रांसमिशन के बिना privacy सुरक्षा सुनिश्चित होती है
- WhisperKit और LLM.swift पर आधारित, Hugging Face models को अपने-आप डाउनलोड करके cache में सेव करता है
- smart cleanup फीचर से अनावश्यक शब्द हटते हैं और self-correction अभिव्यक्तियों को सुधारा जाता है, menu bar ऐप के रूप में बैकग्राउंड में चलता है
- MIT license open source के रूप में उपलब्ध है और Apple Silicon macOS 14 या उससे ऊपर पर चलता है
अवलोकन
- Ghost Pepper macOS के लिए एक पूरी तरह लोकल speech-to-text कन्वर्ज़न ऐप है, जो Control key दबाकर बोलने और छोड़ते ही अपने-आप टेक्स्ट में बदलकर paste करने की सुविधा देता है
- यह cloud API का उपयोग नहीं करता, और सभी डेटा व models सिर्फ लोकल में प्रोसेस होते हैं
- Apple Silicon(M1 या उससे ऊपर) आधारित macOS 14.0 या उससे ऊपर पर चलता है
- यह menu bar ऐप के रूप में चलता है और login पर अपने-आप शुरू किया जा सकता है
- MIT license के तहत जारी एक open source प्रोजेक्ट है
मुख्य फीचर्स
- Control key दबाकर बोलें → key छोड़ते ही अपने-आप text conversion और paste
- लोकल execution structure की वजह से speech recognition और post-processing models दोनों Mac के अंदर ही चलते हैं
- smart cleanup फीचर अनावश्यक शब्दों (uh, um आदि) को हटाता है और self-correction अभिव्यक्तियों को अपने-आप सुधारता है
- menu bar-only interface के साथ Dock icon के बिना बैकग्राउंड में काम करता है
- user settings support: cleanup prompt बदलना, mic चुनना, फीचर on/off करना संभव
काम करने का तरीका
- सभी models open source आधारित हैं और पहली बार चलाने पर अपने-आप डाउनलोड होकर लोकल cache में सेव हो जाते हैं
- speech recognition WhisperKit से और text cleanup LLM.swift के जरिए किया जाता है
- model files Hugging Face से उपलब्ध कराई जाती हैं
-
speech recognition models
- Whisper tiny.en (~75MB): सबसे तेज़ English-only model
- Whisper small.en (~466MB): डिफॉल्ट, उच्च accuracy वाला English-only model
- Whisper small (multilingual): बहुभाषी support
- Parakeet v3 (~1.4GB): 25 भाषाओं का support, FluidAudio आधारित
-
text cleanup models
- Qwen 3.5 0.8B (~535MB): डिफॉल्ट, लगभग 1~2 सेकंड में प्रोसेसिंग
- Qwen 3.5 2B (~1.3GB): तेज़ प्रोसेसिंग स्पीड (लगभग 4~5 सेकंड)
- Qwen 3.5 4B (~2.8GB): सर्वोत्तम quality (लगभग 5~7 सेकंड)
इंस्टॉलेशन और रन
-
ऐप इंस्टॉलेशन
- GhostPepper.dmg डाउनलोड करें
- DMG खोलने के बाद Applications folder में drag करें
- Microphone और Accessibility permissions की अनुमति दें
- Control key दबाकर बोलें और उपयोग शुरू करें
-
source build
- repository clone करें
GhostPepper.xcodeproj को Xcode में खोलें
- Cmd+R से build और run करें
permission आवश्यकताएँ
| permission |
उद्देश्य |
| Microphone |
आवाज़ रिकॉर्ड करना |
| Accessibility |
global shortcut और auto-paste चलाना |
अतिरिक्त जानकारी
- login पर अपने-आप चलना डिफॉल्ट रूप से सक्षम है, और settings में इसे बंद किया जा सकता है
- disk पर कोई logs सेव नहीं होते — बदला गया टेक्स्ट file में रिकॉर्ड नहीं होता, और debug logs केवल memory में रखे जाते हैं और ऐप बंद होने पर हटा दिए जाते हैं
तकनीकी संरचना और dependencies
- WhisperKit: speech recognition engine
- LLM.swift: text cleanup के लिए लोकल LLM
- Hugging Face: model hosting
- Sparkle: macOS ऐप update management
नाम का अर्थ
- सभी models सिर्फ लोकल में चलते हैं, इसलिए व्यक्तिगत डेटा बाहर नहीं भेजा जाता
- Ghost Pepper(तीखी मिर्च) नाम मुफ़्त में मिलने वाली शक्तिशाली क्षमताओं का प्रतीक है
एंटरप्राइज़ और managed devices support
- ऐप को Accessibility permission चाहिए, जिसके लिए आमतौर पर admin permission की आवश्यकता होती है
- MDM environments(Jamf, Kandji, Mosaic आदि) में PPPC(Privacy Preferences Policy Control) profile के जरिए पहले से अनुमति दी जा सकती है
- Bundle ID:
com.github.matthartman.ghostpepper
- Team ID:
BBVMGXR9AY
- Permission: Accessibility (
com.apple.security.accessibility)
अभी कोई टिप्पणी नहीं है.