25 पॉइंट द्वारा xguru 2025-10-18 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • SwiftUI में बना एक native macOS ऐप, जो स्क्रीन को 1 FPS पर रिकॉर्ड करता है और हर 15 मिनट में AI analysis चलाकर अपने आप टाइमलाइन और summary बनाता है
    • Timelapse को चलाकर दिन के प्रवाह को विज़ुअली दोबारा देखा जा सकता है
  • लगभग 25MB app size, ~100MB RAM, <1% CPU उपयोग को लक्ष्य बनाकर हल्का और low-overhead डिज़ाइन अपनाता है, और बिना distributed components के local-first UX देता है
  • AI processing के लिए Gemini (अपनी key डालकर) या local models (Ollama·LM Studio) चुने जा सकते हैं
  • रिकॉर्ड किया गया डेटा 3 दिन रखने के बाद अपने आप साफ़ किया जाता है, जिससे resource management और privacy दोनों बेहतर रहती हैं
  • Coming Soon
    • अनंत रूप से customize किया जा सकने वाला dashboard : कोई भी सवाल पूछें, परिणाम को tiles में बदलकर लगातार track किया जा सकेगा
    • Daily journal : highlight reflection, guided prompts का उपयोग, और screenshots व notes को टाइमलाइन के साथ रिकॉर्ड करना
  • यह कैसे काम करता है
    • Capture: स्क्रीन को 1 FPS पर 15-second chunks में रिकॉर्ड किया जाता है
    • Analyze: हर 15 मिनट में हाल की chunks को चुने गए AI provider के पास analysis के लिए भेजा जाता है
    • Generate: activity के summary cards बनाकर समयक्रम में टाइमलाइन तैयार की जाती है
    • Display: visual timeline UI में दिन का प्रवाह दिखाया जाता है
    • Cleanup: 3 दिन पुराने recordings अपने आप delete करके storage space manage किया जाता है

2 टिप्पणियां

 
oh3vci 2025-10-21

मैं इसे लोकल में इस्तेमाल करके देख रहा हूँ, लेकिन लगता है कि यह Korean का विश्लेषण ठीक से नहीं कर पाता। जो रिकॉर्ड होता दिख रहा है, उसे देखकर लगा कि केवल वे हिस्से ही रिकॉर्ड हो रहे थे जो English में लिखे गए थे।

 
GN⁺ 2025-10-18
Hacker News राय
  • लगता है कि अगर इस प्रोडक्ट को वकीलों या घंटे के हिसाब से बिल करने वाले प्रोफेशनल्स को बेचा जाए तो अच्छा रिस्पॉन्स मिल सकता है, क्योंकि यह दिन भर छूटे हुए काम को फिर से सामने लाकर billing leakage रोक सकता है, इसलिए वे इसके लिए ऊँची कीमत भी देने को तैयार हो सकते हैं

    • दूसरी तरफ, यह भी सामने आ सकता है कि वकील वास्तव में अपने दर्ज समय के मुकाबले कितना कम काम करते हैं
    • मैं भी एक software contractor के रूप में हमेशा ऐसी सुविधा चाहता था, अभी Linux पर इसका एक साधारण prototype बना रहा हूँ
    • UK में तो घंटे के हिसाब से भी नहीं, 6-मिनट यूनिट में बिल किया जाता है, यह वहाँ की work culture के बारे में बहुत कुछ बताता है
  • बढ़िया प्रोडक्ट है! मैं अभी PC पर work tracking के लिए ActivityWatch इस्तेमाल कर रहा हूँ
    मैं ऐसे software से यह चीज़ें चाहता हूँ

    • distraction की शुरुआत कहाँ से होती है, यह पता लगाने की सुविधा: जैसे किसी खास email को देखने के लिए email window खोलता हूँ, फिर उससे असंबंधित emails भी देखने लग जाता हूँ और 5~15 मिनट तक भटक जाता हूँ, अगर यह जानकारी मिले तो distraction कम करने के लिए action लिया जा सकता है; उदाहरण के लिए, YouTube recommended videos छिपाने वाला plugin लगाने के बाद सच में distraction कम हुआ, और मैं बेकार की windows बंद कर देता हूँ ताकि ध्यान दूसरी चीज़ों पर न जाए
    • दोहराए जाने वाले काम और उनकी periodicity को समझना: जैसे अगर किसी खास exception case के लिए हर हफ्ते लगभग उसी तरह से invoice हाथ से बनाना पड़ता है, तो सोचा जा सकता है कि इसे automate किया जा सकता है या नहीं
    • काम से पहले, काम के दौरान, और काम के बाद mood state रिकॉर्ड करना: यह सबसे व्यापक और परिभाषित करना कठिन सवाल है, लेकिन मुझे लगता है कि procrastination सुधारने और काम शुरू करना आसान बनाने में इसकी बहुत संभावना है
    • अगर लोगों के distraction patterns को समझने में मदद करने वाला feature हो तो बहुत अच्छा होगा, मैं भी वही YouTube extension इस्तेमाल करता हूँ
  • इसे देखते ही लगा कि ऐसा प्रोडक्ट ADHD वाले लोगों के लिए भी बहुत मददगार हो सकता है
    क्या चीज़ distraction पैदा करती है और कौन से recurring patterns मौजूद हैं, यह समझा जा सकता है (जैसे: हर git commit के बाद Hacker News खोलकर 15 मिनट बर्बाद करना)
    अपने आप capture हुए रिकॉर्ड को बाद में review कर पाना बहुत बड़ी बात है, पहले TimeRescue के साथ client time को सटीक मापने में मुझे बहुत सफलता मिली थी
    लेकिन manual input माँगने वाले tools हमेशा focus तोड़ देते हैं या फिर मैं उन्हें इस्तेमाल करना भूल जाता हूँ, इसलिए ज़्यादा दिन नहीं टिकते
    इससे एक कदम आगे जाकर, अगर real time में (processing delay को ध्यान में रखते हुए) यह बताया जा सके कि मैं अभी भटक रहा हूँ, तो बहुत उपयोगी होगा; user खुद भी define कर सके कि distraction क्या है, या feedback से सिस्टम धीरे-धीरे और smart बन जाए, ऐसा भी सोचा जा सकता है
    मुझे यह प्रोडक्ट बहुत आकर्षक लगता है, मुझे Windows Recall जैसी ideas पसंद थीं, और यह privacy-focused प्रोडक्ट देखकर अच्छा लगा

  • प्रोडक्ट का concept बहुत पसंद आया, लेकिन यह चिंता होती है कि डेवलपर का GitHub लगभग खाली था और अचानक ऐसा app जारी कर दिया जो आसानी से spyware में भी बदल सकता है, खासकर password जैसी security चिंताओं के मामले में

    • अगर source पहले से GitHub पर है, तो profile को लेकर चिंता करने के बजाय सीधे code देखकर इन चिंताओं को काफ़ी आसानी से दूर किया जा सकता है
  • मुझे bank information, password जैसी संवेदनशील data को Gemini को भेजना असहज लगता है
    local model इस्तेमाल करने पर performance कितना अलग होगा, यह जानने की उत्सुकता है

    • अगर अपने अनुभव और मूल्यांकन के आधार पर grade दूँ, तो Gemini 2.5 pro को A-, qwen2.5vl को लगभग B-/C+ दूँगा, और क्योंकि नतीजे हमेशा deterministic नहीं होते, quality की गारंटी देना मुश्किल है
      हाल की research papers में देखा कि distillation techniques के ज़रिए local models भी SOTA performance तक पहुँच सकते हैं, इसलिए मैं उस दिशा में खुद experiment करने वाला हूँ
    • अगर enterprise version की बजाय सामान्य Gemini इस्तेमाल करते हैं, तो prompts और responses में मौजूद सारी sensitive information 100% Google के सामने चली जाती है
    • Google के पास पहले से मेरा email, browser, smartphone OS, और कुछ passwords तक हैं, इसलिए मैं लगभग यह मानकर चलता हूँ कि मेरा सारा confidential data पहले ही compromise हो चुका है
    • वैसे passwords सामान्यतः screen पर दिखते नहीं हैं, और password manager से सीधे censored input field में जाते हैं, इसलिए उन्हें screen पर नज़र नहीं आना चाहिए
  • यह screenpipe जैसा मिलता-जुलता concept है, और screenpipe ज्यादा customization देता है
    github.com/mediar-ai/screenpipe

    • मैं screenpipe का founder हूँ, ऐसे और products आना खुशी की बात है; आदर्श रूप से यह OSS, local, vendor lock-in से मुक्त, और API/MCP-friendly होना चाहिए
      अभी कमी यह है कि यह सिर्फ macOS को support करता है, जबकि मैं इन दिनों ज़्यादातर Windows इस्तेमाल करता हूँ
  • शानदार प्रोजेक्ट है! Rewind के साथ मेरा कुछ ऐसा ही अनुभव रहा था, और privacy को लेकर चिंताएँ थीं
    जानकारी के लिए, Rewind OCR को local में process करता है और सिर्फ text data भेजता है
    अगर macOS पर फोकस कर रहे हैं, तो VNRecognizeTextRequest का इस्तेमाल करके जटिल OCR प्रक्रिया को छोड़ा जा सकता है
    खासकर अगर cloud-based AI का उपयोग हो, तो BERT जैसे lightweight model से sensitive information detect और mask की जा सकती है

    • मुझे VNRecognizeTextRequest के बारे में पता नहीं था, यह सच में कमाल का है, बताने के लिए धन्यवाद
  • सोच रहा हूँ कि Zoom या video meeting के दौरान recording नहीं बल्कि capture किया जाए, तो क्या कानूनी रूप से इसे "recording" बताना ज़रूरी होगा
    यह भी जानना चाहता हूँ कि live captions या transcription features होने पर कानूनी आवश्यकताएँ बदलती हैं या नहीं

    • मेरे राज्य में, अगर आप खुद recording कर रहे हैं यह बताए बिना Zoom screen capture करते हैं, तो आमतौर पर यह गैरकानूनी है; मैं पूरी तरह निश्चित नहीं हूँ, लेकिन मुख्य मुद्दा यह है कि क्या 1fps video store हो रहा है, न कि AI summary बन रही है या नहीं
  • यह प्रोडक्ट वाकई बहुत अच्छा है, और मौजूदा time trackers को खुद चलाने की तुलना में दिमागी बोझ काफी कम करता है
    local option और BYO key विकल्प की वजह से privacy choices भी मिलती हैं, यह भी पसंद आया
    लगता है कि इस तरह का प्रोडक्ट पहले आ जाना चाहिए था, और इस बार सच में बहुत अच्छी तरह बनाया गया है

  • मैं भी इसे सिर्फ local model के साथ ही इस्तेमाल करना पसंद करूँगा, वाकई शानदार प्रोडक्ट है

    • मेरे दोस्तों और मेरे बीच local/cloud पसंद लगभग आधी-आधी बँटी हुई है, और यह अच्छा है कि हर व्यक्ति अपनी privacy preference के हिसाब से quality या privacy में से चुनाव कर सकता है