4 पॉइंट द्वारा denimcoder 2025-12-02 | 3 टिप्पणियां | WhatsApp पर शेयर करें

नमस्ते।
मैं एक ऐसा डेवलपर हूँ जो चाहता है कि AI तकनीक लोगों की रोजमर्रा की ज़िंदगी में सकारात्मक बदलाव लाने वाला एक गर्मजोशी भरा टूल बने।

इस विश्वास के साथ कि हर दिन के छोटे-छोटे रिकॉर्ड और आत्मचिंतन मिलकर जीवन बदल देते हैं,
मैंने gratitude diary ऐप 'हरुओनगी' विकसित किया, जिसे कोई भी आसानी से और लगातार इस्तेमाल कर सके।

बाज़ार में पहले से कई शानदार AI diary apps मौजूद हैं, लेकिन मुझे लगा कि सिर्फ टेक्स्ट के ज़रिए सांत्वना पाने की एक सीमा होती है।

मुझे एक ऐसी 'आवाज़' चाहिए थी जो सचमुच किसी दोस्त के पास बैठकर बात करने जैसी लगे।

इसके लिए, मैंने नवीनतम Gemini model का उपयोग करके प्राकृतिक audio feedback लागू किया।

[सेवा परिचय]

हरुओनगी एक ऐसा ऐप है जिसमें gratitude diary लिखने पर, आपके द्वारा चुना गया AI character तुरंत 'वॉइस' में सहानुभूति और प्रोत्साहन भरा जवाब भेजता है।

[मुख्य विशेषताएँ]

  1. AI दोस्त का वॉइस जवाब:
    डायरी लिखते ही, यह सामग्री का विश्लेषण करके वॉइस में feedback तैयार करता है।

  2. 3 अलग-अलग व्यक्तित्व वाले AI दोस्त:

    • उज्ज्वल और गर्मजोशी भरी दोस्त 'Seona': जब आपको positive energy की ज़रूरत हो

    • शांत और स्नेही mentor 'Hyunjun': जब आपको growth के लिए सलाह चाहिए

    • हमेशा आपकी तरफ रहने वाली, सुकून देने वाली 'दादी Sunja': जब आपको गर्मजोशी भरे सांत्वना और सहानुभूति की ज़रूरत हो

  3. डेटा प्राइवेसी:

    • उपयोगकर्ता द्वारा लिखी गई डायरी सामग्री AES256 encryption के साथ सुरक्षित रूप से संग्रहीत की जाती है।

[टेक स्टैक & डेवलपमेंट अनुभव]

  • AI Model: Google Gemini 2.5 Flash Native Audio Preview

    • टेक्स्ट जनरेट करने के बाद TTS जोड़ने वाले तरीके की तुलना में, Native Audio model स्वर, लय और साँस के विराम (Pause) के मामले में कहीं अधिक प्राकृतिक लगा।
    • खासकर 'Sunja (Grandmother)' character की गर्मजोशी भरी और धीमी बोलने की शैली लागू करने में यह प्रभावी रहा।
    • prompts को समायोजित करते हुए, मैं हर character की persona, voice speed, breathing, tone, और emotion expression को नियंत्रित करके मनचाही आवाज़ बना सका।
    • OpenAI के GPT Realtime API पर भी विचार किया गया, लेकिन cost efficiency ($20.00 per 1M tokens) को देखते हुए अंततः Gemini को एकीकृत किया गया।
  • Cost Optimization:

    • audio output token cost टेक्स्ट की तुलना में बहुत अधिक होने के कारण ($12.00 per 1M tokens), system prompt के ज़रिए response length नियंत्रित करने की optimization प्रक्रिया ज़रूरी थी।
  • UI Workflow: Figma Dev Mode के साथ development efficiency बढ़ाई गई।

    • जब AI को Figma के design mockups और asset जानकारी को context के रूप में साथ दिया गया, तो UI implementation का काम काफी आसान हो गया।
  • Backend: Supabase (DB, Auth), Railway (Fastify), Cloudflare R2 (File Storage)

  • Frontend: React Native (Expo), TypeScript

  • Dev Tools: Claude Code (Main), Cursor (Sub)

[समापन]
अगर आज आपका मन थोड़ा थका हुआ है, तो एक बार ज़रूर आइए।
फिलहाल यह केवल Android पर उपलब्ध है।
धन्यवाद।

3 टिप्पणियां

 
denimcoder 2025-12-21

App Store पर भी लॉन्च हो गया है!

https://smplu.link/F8JwF

 
mssmss 2025-12-02

मैंने भी ऐसा ही एक सर्विस बनाकर अकेले इस्तेमाल किया है, इसलिए इसे सपोर्ट करने का मन होता है! उम्मीद है यह एक अच्छा प्रोडक्ट बने। इसे Native Audio में बदलकर फिर से डेवलप करने की कोशिश करनी पड़ेगी।

 
denimcoder 2025-12-03

सपोर्ट के लिए धन्यवादhaha Native Audio मॉडल की आवाज़ काफ़ी नैचुरल है, इसलिए अगर आप इसे इस्तेमाल करके देखें तो मुझे लगता है कि आपका अनुभव अच्छा रहेगा