हरुओनगी - AI वॉइस gratitude डायरी
(play.google.com)नमस्ते।
मैं एक ऐसा डेवलपर हूँ जो चाहता है कि AI तकनीक लोगों की रोजमर्रा की ज़िंदगी में सकारात्मक बदलाव लाने वाला एक गर्मजोशी भरा टूल बने।
इस विश्वास के साथ कि हर दिन के छोटे-छोटे रिकॉर्ड और आत्मचिंतन मिलकर जीवन बदल देते हैं,
मैंने gratitude diary ऐप 'हरुओनगी' विकसित किया, जिसे कोई भी आसानी से और लगातार इस्तेमाल कर सके।
बाज़ार में पहले से कई शानदार AI diary apps मौजूद हैं, लेकिन मुझे लगा कि सिर्फ टेक्स्ट के ज़रिए सांत्वना पाने की एक सीमा होती है।
मुझे एक ऐसी 'आवाज़' चाहिए थी जो सचमुच किसी दोस्त के पास बैठकर बात करने जैसी लगे।
इसके लिए, मैंने नवीनतम Gemini model का उपयोग करके प्राकृतिक audio feedback लागू किया।
[सेवा परिचय]
हरुओनगी एक ऐसा ऐप है जिसमें gratitude diary लिखने पर, आपके द्वारा चुना गया AI character तुरंत 'वॉइस' में सहानुभूति और प्रोत्साहन भरा जवाब भेजता है।
[मुख्य विशेषताएँ]
-
AI दोस्त का वॉइस जवाब:
डायरी लिखते ही, यह सामग्री का विश्लेषण करके वॉइस में feedback तैयार करता है। -
3 अलग-अलग व्यक्तित्व वाले AI दोस्त:
-
उज्ज्वल और गर्मजोशी भरी दोस्त 'Seona': जब आपको positive energy की ज़रूरत हो
-
शांत और स्नेही mentor 'Hyunjun': जब आपको growth के लिए सलाह चाहिए
-
हमेशा आपकी तरफ रहने वाली, सुकून देने वाली 'दादी Sunja': जब आपको गर्मजोशी भरे सांत्वना और सहानुभूति की ज़रूरत हो
-
-
डेटा प्राइवेसी:
- उपयोगकर्ता द्वारा लिखी गई डायरी सामग्री AES256 encryption के साथ सुरक्षित रूप से संग्रहीत की जाती है।
[टेक स्टैक & डेवलपमेंट अनुभव]
-
AI Model: Google Gemini 2.5 Flash Native Audio Preview
- टेक्स्ट जनरेट करने के बाद TTS जोड़ने वाले तरीके की तुलना में, Native Audio model स्वर, लय और साँस के विराम (Pause) के मामले में कहीं अधिक प्राकृतिक लगा।
- खासकर 'Sunja (Grandmother)' character की गर्मजोशी भरी और धीमी बोलने की शैली लागू करने में यह प्रभावी रहा।
- prompts को समायोजित करते हुए, मैं हर character की persona, voice speed, breathing, tone, और emotion expression को नियंत्रित करके मनचाही आवाज़ बना सका।
- OpenAI के GPT Realtime API पर भी विचार किया गया, लेकिन cost efficiency ($20.00 per 1M tokens) को देखते हुए अंततः Gemini को एकीकृत किया गया।
-
Cost Optimization:
- audio output token cost टेक्स्ट की तुलना में बहुत अधिक होने के कारण ($12.00 per 1M tokens), system prompt के ज़रिए response length नियंत्रित करने की optimization प्रक्रिया ज़रूरी थी।
-
UI Workflow: Figma Dev Mode के साथ development efficiency बढ़ाई गई।
- जब AI को Figma के design mockups और asset जानकारी को context के रूप में साथ दिया गया, तो UI implementation का काम काफी आसान हो गया।
-
Backend: Supabase (DB, Auth), Railway (Fastify), Cloudflare R2 (File Storage)
-
Frontend: React Native (Expo), TypeScript
-
Dev Tools: Claude Code (Main), Cursor (Sub)
[समापन]
अगर आज आपका मन थोड़ा थका हुआ है, तो एक बार ज़रूर आइए।
फिलहाल यह केवल Android पर उपलब्ध है।
धन्यवाद।
3 टिप्पणियां
App Store पर भी लॉन्च हो गया है!
https://smplu.link/F8JwF
मैंने भी ऐसा ही एक सर्विस बनाकर अकेले इस्तेमाल किया है, इसलिए इसे सपोर्ट करने का मन होता है! उम्मीद है यह एक अच्छा प्रोडक्ट बने। इसे Native Audio में बदलकर फिर से डेवलप करने की कोशिश करनी पड़ेगी।
सपोर्ट के लिए धन्यवादhaha Native Audio मॉडल की आवाज़ काफ़ी नैचुरल है, इसलिए अगर आप इसे इस्तेमाल करके देखें तो मुझे लगता है कि आपका अनुभव अच्छा रहेगा