11 पॉइंट द्वारा GN⁺ 2024-04-22 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • कभी-कभी पहले पढ़ी या देखी गई किसी चीज़ को याद करने की कोशिश करते समय, सभी ऐप्स खंगालने पर भी वह नहीं मिलती
  • खासकर कई web pages, वीडियो, chat messages आदि में बिखरी जानकारी पल भर में सामने आकर गायब हो जाती है, इसलिए याददाश्त टटोलने या browser history देखने पर भी ऐसा लगता है मानो वह कभी थी ही नहीं
  • और भी बुरी बात यह है कि वह जानकारी हटाई, छिपाई या बदली भी जा सकती है

पर्सनल मेमोरी स्टोरेज ऐप बनाने की प्रेरणा

  • एक ऐसे व्यक्ति के रूप में जिसकी याददाश्त बहुत अच्छी नहीं है, लेकिन जिसे महत्वपूर्ण चीज़ें छूट जाने का डर (FOMO) रहता है, मैंने यह ऐप Windows के लिए बनाया
  • मुख्य प्रेरणा Mac ऐप Rewind के शुरुआती कॉन्सेप्ट और Black Mirror S1E3 "The Entire History of You" से मिली
    • लक्ष्य यह था कि पात्रों की तरह आँखों से सब कुछ रिकॉर्ड किया जा सके, और कंप्यूटर स्क्रीन पर दिखी हर चीज़ को rewind या search किया जा सके
  • यह ऐप कई अतिरिक्त फायदे भी देता है
    • लोकल में संग्रहीत, बदला न जा सकने वाला निजी मेमोरी रिकॉर्ड
    • याद दिलाने वाले सुराग खो जाने का जोखिम नहीं
    • software failure होने पर काम को restore किया जा सकता है
    • डाउनलोड किए गए डेटा के स्रोत को ट्रैक किया जा सकता है
    • अतीत में अनदेखी रह गई जानकारी को खोजा जा सकता है
    • (व्यक्तिगत रूप से, यह दोस्तों के साथ मज़ाक करने का एक टूल भी बन गया है)

ऐप कैसे काम करता है

  • ffmpeg का उपयोग करके स्क्रीन को 15 मिनट के छोटे-छोटे chunk files में रिकॉर्ड किया जाता है, फिर Windows local OCR API और image embeddings का उपयोग करके उन्हें index किया जाता है
  • आप चाहें तो कुछ खास programs या स्क्रीन के कुछ क्षेत्रों को ignore करने के लिए चुन सकते हैं
  • यह सब एक local web UI interface के जरिए rewind या search किया जा सकता है, जैसे window title, text keywords, image descriptions आदि
  • इस डेटा का उपयोग daily और periodic screen time, circadian summaries, monthly lightbox generation जैसी overview features जोड़ने के लिए भी किया गया है

प्राइवेसी और ओपन सोर्स

  • चूँकि मैं प्राइवेसी को महत्व देता हूँ, इसलिए सब कुछ केवल कंप्यूटर पर ही होता है और cloud में कुछ भी store नहीं किया जाता
  • Python का उपयोग करके सब कुछ पारदर्शी तरीके से बनाया गया है, इसलिए उपयोगकर्ताओं के लिए इसे खुद संशोधित करना आसान है (हालाँकि performance थोड़ी धीमी हो सकती है)
  • यह बिना subscription fee के मुफ्त है, और डेटा पूरी तरह उपयोगकर्ता का रहता है

प्रोजेक्ट की वर्तमान स्थिति और आगे की योजना

  • मैं पेशेवर डेवलपर नहीं हूँ, इसलिए यह प्रोजेक्ट व्यक्तिगत रुचि और उपयोग की ज़रूरत से बना है; हो सकता है यह परफेक्ट न हो और इसमें कुछ समस्याएँ हों
  • लेकिन कुछ समय तक इस्तेमाल करने के बाद, मुझे लगता है कि यह काफ़ी mature और stable है
  • यदि आप इस प्रोजेक्ट में रुचि रखते हैं, तो चर्चा में शामिल होने, समस्याएँ उठाने या योगदान देकर इसे बेहतर ऐप बनाने का स्वागत है
  • (मुझे पक्का नहीं है कि Windows पर इससे मिलते-जुलते ऐप पहले से मौजूद हैं या नहीं; Linux पर Memento जैसे ऐप होने की जानकारी है। अगर आपको पता हो तो बताइए)

1 टिप्पणियां

 
GN⁺ 2024-04-22
Hacker News टिप्पणी

DejaView प्रोजेक्ट सारांश:

  • 20 साल पहले विकसित किया गया प्रोजेक्ट, जो डेस्कटॉप कंप्यूटर उपयोग के इतिहास को रिकॉर्ड, रीप्ले, खोज और फिर से शुरू करने की सुविधा देता है
  • स्क्रीन आउटपुट, एप्लिकेशन/फाइलसिस्टम स्टेट को checkpoint के रूप में रिकॉर्ड करता है, और दिखाई गए टेक्स्ट को संदर्भ जानकारी के साथ कैप्चर करके index करता है
  • उपयोगकर्ता डेस्कटॉप पर दिखाई गई सभी विज़ुअल जानकारी खोज सकते हैं, और उस समय की स्थिति में वापस जाकर इंटरैक्ट कर सकते हैं
  • एप्लिकेशन, Windows सिस्टम, या OS kernel में बदलाव किए बिना virtualization के ज़रिए पारदर्शी रूप से काम करता है
  • वास्तविक डेस्कटॉप ऐप्स पर मूल्यांकन के नतीजे बताते हैं कि इतना कम overhead है कि उपयोगकर्ता उसे महसूस भी न करें, और खोज व रीप्ले इंटरैक्टिव उपयोग के लिए पर्याप्त तेज़ हैं

समान प्रोजेक्ट परिचय:

  • macOS के लिए open source प्रोजेक्ट rem HN पर पेश किया गया था और उस पर काफ़ी सक्रिय चर्चा हुई थी
  • Windows के लिए commercial प्रोजेक्ट TimeSnapper भी मौजूद है

प्रोजेक्ट पर राय:

  • यह लंबे समय से मन में रही एक आइडिया थी, इसलिए किसी को इसे लागू करते देखना भावुक कर देने वाला है
  • लेकिन इससे data security के बड़े जोखिम दिखते हैं। ऐप के ख़ुद के दुर्भावनापूर्ण व्यवहार को रोकने के तरीकों पर सोचने की ज़रूरत है
  • OCR की जगह accessibility API का उपयोग करने पर टेक्स्ट सीधे मिल सकता है, जिससे यह कहीं ज़्यादा efficient होगा। यह LLM और UI को जोड़ने और training data इकट्ठा करने का भी अच्छा तरीका हो सकता है

अतीत के समान प्रोजेक्ट उदाहरण:

  • 2014 में Savant Recall YC में चयनित नहीं हुआ और बाद में open source के रूप में जारी किया गया
  • Napster के सह-संस्थापक ने इसे अधिग्रहित किया, नाम बदलकर Atlas Recall रखा, UI में सुधार किया और 2 करोड़ डॉलर का निवेश जुटाया, लेकिन सिर्फ़ 1 साल बाद Xinova द्वारा अधिग्रहित होने पर सेवा अचानक बंद हो गई
  • 2019 में Apse नाम का एक प्रोजेक्ट भी था

अन्य:

  • GitHub विवरण के अनुसार सालाना लगभग 100-200GB रिकॉर्डिंग स्टोरेज की ज़रूरत होने की उम्मीद है, जो बुरा नहीं है
  • नई आइडिया को अच्छी तरह लागू करने पर बधाई। यह उन सभी लोगों के लिए प्रेरणादायक है जो सोचते हैं, "ऐसा ऐप क्यों नहीं है"
  • यह Apse.io जैसा लगता है, जो OCR से स्क्रीन पर दिखाई देने वाली हर चीज़ का searchable index बनाता है। Windrecorder का open source पहलू पसंद आया
  • कर्मचारियों के workstations पर spyware इंस्टॉल करना चाहने वाली बड़ी कंपनियों को यह आसानी से $5 प्रति seat पर बेचा जा सकता है