मैंने एक ऐसा ऐप बनाया है जो macOS मेन्यू बार में टेक्स्ट चुनें → शॉर्टकट दबाएँ → AI से उसका समझाया हुआ उत्तर पाएं
(miniai.dev)नमस्ते। मैं मेडिकल कॉलेज का छात्र हूँ, और 2 महीने पहले से vibe coding खुद सीखते हुए मैंने एक macOS मेन्यू बार ऐप बनाया। आज इसे सार्वजनिक कर रहा हूँ!
MiniAI - यह ऐप क्या करता है
कहीं भी टेक्स्ट चुनें और तय किया हुआ शॉर्टकट दबाएँ, तो मेन्यू बार में एक छोटी विंडो खुलती है और AI उसका समझाया हुआ उत्तर देता है। ब्राउज़र में जाकर Google करना और फिर वापस लौटना — यह पूरा झंझट खत्म करना ही इसका मुख्य मकसद है।
शुरू में इसे मैंने रिसर्च पेपर पढ़ते समय अनजान शब्द खोजने की झुंझलाहट की वजह से बनाया था, लेकिन बनाकर देखा तो अंग्रेज़ी ईमेल लिखते समय, कोड देखते समय, और कई दूसरी स्थितियों में भी इसका इस्तेमाल होने लगा।
टेक स्टैक
- UI: NSPanel + SwiftUI (मेन्यू बार ऐप की floating window)
- AI response: SSE streaming से real-time typing effect
- Backend: Supabase Edge Function के जरिए API proxy (ताकि client में API key एम्बेड न करनी पड़े)
- Rate limiting: PostgreSQL आधारित per-user limit
- Deployment: Developer ID signing + notarization पूरा
डेवलपमेंट के दौरान जिस हिस्से पर सबसे ज़्यादा समय लगा
- global text selection detect करना (Accessibility API permission handling)
- API key security (शुरुआत में client में hardcode कर दी थी, बाद में पता चलने पर पूरा बदलना पड़ा)
- notarization process (पहला अनुभव था, 2 दिन यहीं निकल गए)
खासकर 3 नंबर वाली बात से macOS ऐप deploy कर चुके लोग शायद सहमत होंगे। डॉक्युमेंटेशन फॉलो करने पर भी कई स्टेप्स ऐसे थे जो एक बार में काम नहीं करते थे।
अभी की स्थिति
- beta public, free
- डाउनलोड homepage से
फ़ीडबैक का स्वागत है
- शॉर्टकट UX स्वाभाविक लगता है या नहीं
- clean install पर कोई समस्या तो नहीं
- architecture में सुधार की गुंजाइश है या नहीं
- इसी तरह का ऐप बना चुके लोगों की सलाह
architecture के सुधार बिंदु या macOS notarization से जुड़ी मुश्किलों का अनुभव साझा करें, उसका भी स्वागत है।
और एक बात और — जो लोग डेवलपर के रूप में अपनी मुख्य नौकरी के अलावा side में प्रोडक्ट बनाते हैं,
"क्या इसे और गहराई से आगे बढ़ाऊँ" vs "इसे एक अनुभव मानकर छोड़ दूँ और अगले पर बढ़ूँ" — इस फैसले तक आप कैसे पहुँचते हैं, यह जानने में दिलचस्पी है।
16 टिप्पणियां
नमस्ते, कुछ सुझाव देना चाहता हूँ!
opt + spaceहोती है। इसलिए लगा कि डिफ़ॉल्ट शॉर्टकट कुछ और होना बेहतर हो सकता है।वाह, आपने इसे इतनी बारीकी से देखा—इसके लिए सच में बहुत धन्यवाद 🙏
शॉर्टकट: जी, सही कहा। Alfred/Raycast यूज़र्स से ⌥Space conflict issue
सबसे ज़्यादा सुनने को मिल रहा है। हमें custom shortcut setting feature का
पता है, और इसे improvement priority में रखेंगे!
साइनिंग/नोटराइज़ेशन: जी, अभी यह adhoc signing state में है।
अभी development की शुरुआती stage होने की वजह से notarization cost थोड़ी बोझिल लगी,
इसलिए उसे होल्ड पर रखा था 😅
इसे चेक करने के लिए धन्यवाद!
डिस्ट्रीब्यूशन तरीका: App Store या Homebrew Cask distribution पर भी विचार कर रहे हैं।
अभी जल्दी release करने के लिए पहले DMG के रूप में जारी किया,
लेकिन मुझे लगता है कि आपने जो दिशा बताई, वह सही है,,
आपने खुद codesign तक चेक किया, यह देखकर मैं सच में भावुक हो गया।
प्रोडक्ट के लिए इतना लगाव दिखाने के लिए दिल से बहुत-बहुत धन्यवाद!
अगर आगे भी कोई असुविधा हो, तो ज़रूर बताइए—आपका समर्थन बहुत हौसला देता है 😄
अगर आप इसे खास तौर पर production level पर बेच नहीं रहे हैं, तो शायद इसे GitHub पर open source के रूप में सार्वजनिक करके feedback लेना भी ठीक रहेगा?
बहुमूल्य राय के लिए धन्यवाद!
क्योंकि यह मेरा इस तरह का पहला संबंधित बिज़नेस था, इसलिए मैंने इसे अनुभव के तौर पर आगे बढ़ाया था, लेकिन लगता है कि इसे open source के रूप में जारी करना भी एक अच्छा आइडिया हो सकता है ताकि बहुत से लोग इसे सीधे इस्तेमाल कर सकें 😁
अगर मैं इसे open source के रूप में जारी करूं, तो आपको ज़रूर feedback देना होगा~~ :)
ओपन सोर्स होने का मतलब यह नहीं है कि आप इसे बेच नहीं सकते। काफ़ी ऐप्स two-track तरीके से भी चलते हैं। ओपन सोर्स का कॉन्सेप्ट आम लोगों से ज़्यादा, प्रोजेक्ट में दिलचस्पी रखने वाले दूसरे डेवलपर्स के साथ मिलकर बनाने का होता है। अगर आपको यह चिंता है कि कोई चुरा ले जाएगा, तो लाइसेंस साफ़-साफ़ लगा सकते हैं, लेकिन... इस AI युग में clean-room projects इतनी भरमार में हैं कि उसका कितना मतलब रह जाता है, कहना मुश्किल है। अगर आप इसे ओपन सोर्स कर दें, तो क्या हम सिर्फ़ feedback ही देंगे? हाहा
हाहा, आपके सीनियर डेवलपर की सलाह के लिए धन्यवाद
आजकल दुनिया इतनी तेज़ी से बदल रही है कि उसके साथ खुद को ढालना बहुत मुश्किल लग रहा है!
इतनी सारी जानकारी देने के लिए धन्यवाद, और आगे भी कृपया अपना रुचि और समर्थन बनाए रखें 😁
यह कौन-सा AI मॉडल है??
इसमें लिखा है कि Claude API का उपयोग किया गया है।
यह तो मुख्य लेख में साफ़-साफ़ लिखा था, इसलिए मैं घबरा गया कि कहीं यह वही सवाल तो नहीं था जो मैंने पूछा ही नहीं, और फिर ढूंढने लगा।
सारांश, मूल लेख, साइट, प्रोग्राम इंस्टॉल करके काफ़ी देर तक ढूंढता रहा, लेकिन नहीं मिला; बाद में देखा कि यह privacy policy में लिखा था।
आमतौर पर tech stack देखने के लिए कोई privacy policy तक खंगालता नहीं है।
अगली बार यह भी बता दें कि यह कहाँ लिखा है, तो आभारी रहूँगा।
कीमती फ़ीडबैक के लिए सच में बहुत धन्यवाद!
मैं मॉडल से जुड़ी बात का ज़िक्र लिखने वाला था, लेकिन लगा कि आम लोग शायद API की अवधारणा को अच्छी तरह नहीं जानते होंगे, इसलिए उसका उल्लेख नहीं किया था।
चूंकि कुछ लोगों को इस बारे में जिज्ञासा है, मैं उसे संशोधित कर दूँगा।
क्या आपने ऐप इस्तेमाल करके देखा? आपका अनुभव कैसा रहा, यह जानने की उत्सुकता है :)
अरे, यह बात मैं jhk0530 को बता चुका हूँ
Claude API इस्तेमाल करने की बात कहाँ लिखी है?
मैंने मुख्य लेख और वेबसाइट दोनों देखे, लेकिन मुझे नहीं दिखा।
नमस्ते! मैं इसका निर्माता हूँ।
मैं अभी Claude Sonnet 4 मॉडल का उपयोग कर रहा हूँ!
आगे चलकर BYOK या दूसरे मॉडल भी सीधे चुन सकें, इसके लिए एक विकल्प लागू करने की योजना है।
रुचि दिखाने के लिए धन्यवाद :)
उत्तर के लिए धन्यवाद!
मैं DeepL की पॉप-अप translation feature का इस्तेमाल करता रहा हूँ, लेकिन इसे भी थोड़ी देर के लिए आज़माना चाहूँगा।
आगे चलकर https://www.openresponses.org/ फ़ॉर्मैट को भी support किया जाए, ताकि local LLM भी इस्तेमाल किए जा सकें, तो उसे open करने का तरीका भी अच्छा लग सकता है!
लगता है कि आप इसे मुख्य रूप से translation फीचर के लिए इस्तेमाल करने वाले हैं!
आगे चलकर हम mode selection फीचर भी जोड़ने की योजना रखते हैं, ताकि थोड़ा और specialized translation फीचर दे सकें :)
external API के अलावा local model के साथ इस्तेमाल करने के तरीके सुझाने के लिए भी धन्यवाद! इसे हम आगे की implementation plan में जोड़ेंगे।
आपकी मूल्यवान feedback के लिए धन्यवाद, और अगर कोई असुविधा हो तो कृपया ज़रूर बताइए 😄
मैंने इसे एक हफ़्ते तक इस्तेमाल किया है, और user experience अच्छा होने की वजह से मैं इसे लगातार इस्तेमाल कर रहा हूँ। धन्यवाद।
अगर बाकी लोगों की तरह shortcut key distribution method की समस्या भी हल हो जाए तो और भी अच्छा होगा! काफी उम्मीदें हैं