18 पॉइंट द्वारा GN⁺ 2026-03-26 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • दादी के घर में मिली 1,351 पारिवारिक तस्वीरों को व्यवस्थित करते समय यादों को संरचित करने के लिए MediaWiki-आधारित निजी wiki बनाया गया
  • wiki फ़ॉर्मैट में तस्वीरों, लोगों और घटनाओं को जोड़ते हुए पारिवारिक और व्यक्तिगत इतिहास को लेखों के रूप में फिर से निर्मित किया गया
  • इसके बाद Google Photos, लोकेशन हिस्ट्री, वित्तीय लेनदेन, म्यूज़िक पहचान डेटा जैसी विभिन्न डिजिटल छापों को जोड़कर Claude Code और language model से स्वतः पेज जनरेशन का प्रयोग किया गया
  • इस प्रक्रिया में मॉडल ने यादों के खाली हिस्सों को पुनर्स्थापित किया और बातचीत, यात्राओं व दोस्ती के प्रवाह को डेटा-आधारित कथा में पुनर्गठित किया
  • नतीजतन यह whoami.wiki open source project के रूप में विकसित हुआ, जो एक ऐसी प्रणाली प्रस्तुत करता है जिसमें व्यक्ति अपने डेटा को विश्वकोश की तरह खोज और स्वामित्व में रख सकता है

व्यक्तिगत विश्वकोश परियोजना की शुरुआत

  • महामारी के बाद पहली बार दादी के घर जाकर 1,351 पुरानी तस्वीरें मिलीं और उन्हें व्यवस्थित करने का काम शुरू किया गया
    • इन तस्वीरों में दादा-दादी की युवावस्था से लेकर लेखक के मिडिल स्कूल के समय तक की झलकें शामिल थीं
    • शुरुआती वर्गीकरण फ़िल्म के प्रकार या फोटो अनुपात जैसी भौतिक विशेषताओं के आधार पर किया गया
  • तस्वीरों को व्यवस्थित करते हुए यादों के बिखरे हुए किस्से उभरते रहे, लेकिन उनका क्रम और संदर्भ स्पष्ट नहीं था
    • EXIF metadata से पहले के दौर की तस्वीरें होने के कारण समय-क्रम समझना कठिन था
  • दादी के साथ तस्वीरों को फिर से सजाते हुए शादी के समय की यादों को मौखिक रूप में दर्ज किया गया
    • लोगों के नाम और घटनाएँ नोट की गईं, और कुछ की पहचान रिश्तेदारों के युवा दिनों की तस्वीरों के रूप में हुई
  • इन रिकॉर्ड्स को व्यवस्थित कर MediaWiki को लोकल पर चलाया गया और वास्तविक Wikipedia शैली में संपादन किया गया
    • infobox, मुख्य पाठ, फोटो caption, व्यक्ति लिंक आदि सहित संरचित पेज लिखे गए
    • संबंधित कानूनी संशोधन, रीति-रिवाज, स्थान आदि को वास्तविक Wikipedia पेजों से जोड़ा गया

wiki software के ज़रिए यादों का पुनर्निर्माण

  • सिर्फ दो दिनों में तस्वीरों की ऐतिहासिक पृष्ठभूमि को पूर्ण लेखों के रूप में व्यवस्थित कर लिया गया
    • इससे महसूस हुआ कि wiki software ज्ञान और media को संरक्षित करने का एक शक्तिशाली साधन है
  • इसके बाद कई महीनों तक पूरे पारिवारिक फोटो संग्रह को wiki पेजों में विस्तारित किया गया
    • r/genealogy community की सलाह से मौखिक इतिहास दर्ज करने का तरीका बेहतर किया गया
    • voice transcription और language model का उपयोग कर संपादन दक्षता बढ़ाई गई
  • wiki फ़ॉर्मैट की वजह से घटनाओं और व्यक्तियों के बीच संबंध आसानी से समझ में आए
    • उदाहरण के लिए, यह पता चला कि दादा-दादी की शादी में गाने वाली गायिका वही नर्स थीं जिन्होंने लेखक का जन्म कराया था

डिजिटल डेटा और language model का संयोजन

  • इसके बाद इसे Google Photos की डिजिटल तस्वीरों तक विस्तारित किया गया
    • EXIF metadata की मदद से तारीख, समय और स्थान की जानकारी का उपयोग संभव हुआ
  • 2012 की एक पारिवारिक यात्रा की 625 तस्वीरों के आधार पर Claude Code से wiki पेज बनाने को कहा गया
    • ImageMagick से बनाई गई contact sheet के आधार पर इमेज ब्राउज़ की गईं
    • मॉडल ने सिर्फ दृश्य जानकारी और timestamp के आधार पर स्थानों और गतिविधियों का पुनर्निर्माण किया
    • इसमें परिवहन के साधन, घूमे गए स्थान और व्यक्तियों की पहचान जैसी विस्तृत बातें शामिल थीं
  • तैयार मसौदे में लेखक की व्यक्तिगत घटनाओं की सूची जोड़कर कथा को पूरा किया गया

बहु-स्रोत डेटा एकीकरण का प्रयोग

  • इसके बाद 2022 की Mexico City यात्रा के डेटा पर विस्तार किया गया
    • 291 तस्वीरें, 343 वीडियो, Google Maps लोकेशन हिस्ट्री, Uber यात्रा, बैंक लेनदेन, Shazam रिकॉर्ड को एकीकृत किया गया
  • Claude Code द्वारा किए गए प्रमुख कार्य
    1. बैंक लेनदेन और लोकेशन डेटा का cross-analysis कर जाकर खाए गए रेस्तरां की पहचान
    2. टिकट भुगतान रिकॉर्ड से फुटबॉल मैच की टीमों और प्रतियोगिता के नाम की पहचान
    3. Uber यात्रा रिकॉर्ड से यात्रा समय और स्थान का पता लगाना
    4. Shazam रिकॉर्ड से अलग-अलग स्थानों के संगीत genre का वर्णन
    5. रात के खाने के दौरान गिटार बजाने वाले दृश्य को वीडियो फ्रेम में ढूंढकर पेज में शामिल करना
  • MediaWiki के discussion page, category, revision history फीचर्स का वैसा ही उपयोग किया गया
    • हर नए डेटा जुड़ने पर वास्तविक wiki editor की तरह संशोधन इतिहास जमा होता गया

व्यक्तिगत डेटा का विश्वकोशीकरण

  • समय के साथ मॉडल की भूमिका यादों के खालीपन को भरने की ओर बदल गई
    • मॉडल ने कई डेटा स्रोतों का cross-analysis करके भूले हुए तथ्यों को पुनर्स्थापित किया
  • Facebook, Instagram, WhatsApp archives के लगभग 1 लाख संदेशों और voice notes का विश्लेषण किया गया
    • दोस्तों के साथ हुई बातचीत से दोस्ती के प्रवाह और जीवन की घटनाओं को निकालकर पेज बनाए गए
    • दोस्तों ने वे पेज पढ़कर पूरी सामग्री में डूब जाने लायक रुचि दिखाई
  • इस प्रक्रिया के माध्यम से यह सिर्फ पारिवारिक इतिहास की परियोजना नहीं रही, बल्कि personal encyclopedia बनाने की दिशा में विकसित हुई
    • डेटा-आधारित, संरचित और परस्पर जुड़ी आत्म-रिकॉर्ड प्रणाली पूरी हुई

whoami.wiki project का सार्वजनिक विमोचन

  • इसी अनुभव के आधार पर whoami.wiki को open source के रूप में जारी किया गया
    • MediaWiki-आधारित, जो व्यक्तिगत डेटा से wiki पेज स्वतः बनाता है
    • उपयोगकर्ता अपना data export देते हैं और language model मसौदा तैयार करता है
    • लोकल रन, डेटा स्वामित्व बनाए रखना, और model independence सुनिश्चित करना
  • किसी व्यक्ति की शादी, दोस्त, यात्रा जैसे सभी विषयों को public wiki जैसे ही फ़ॉर्मैट में दर्ज किया जा सकता है
  • तैयार पेजों को एक्सप्लोर करने का अनुभव शुरुआती Facebook timeline जैसी खुशी देता है
  • तकनीक से भी अधिक महत्वपूर्ण है लोगों और यादों की नई खोज
    • दादी के जीवन को दर्ज करते हुए उनकी मजबूती और resilience को नए सिरे से पहचाना गया
    • दोस्तों के साथ रिश्तों को पलटकर देखते हुए कृतज्ञता और जुड़ाव की भावना फिर से मिली
  • परियोजना अभी शुरुआती चरण में है, और कोई भी installation documents के जरिए इसे खुद शुरू कर सकता है
    • डेटा उपयोगकर्ता के स्वामित्व में रहता है, और संरचना ऐसी है जिसे कोई भी model पढ़ सकता है
    • सहयोगियों के feedback के आधार पर इसे लगातार बेहतर बनाया जा रहा है

1 टिप्पणियां

 
GN⁺ 2026-03-26
Hacker News की राय
  • मुझे लगता है यह प्रोजेक्ट वाकई शानदार है और परिवार के इतिहास को संरक्षित करने का एक दिलचस्प तरीका है
    लेकिन जहाँ AI शामिल हुआ, वहाँ इसे लेकर मेरी भावनाएँ थोड़ी जटिल रहीं
    इसमें कुछ कड़वाहट थी, जैसे किसी कारीगर के हाथ का काम फैक्टरी से पीछे छूट रहा हो, और साथ ही AI का बैंक रिकॉर्ड, टिकट और संगीत इतिहास तक cross-analysis करना थोड़ा dystopian भी लगा
    फिर भी, कुल मिलाकर यह बेहद प्रभावशाली प्रयास था

    • धन्यवाद :)
      मैंने भी शुरुआत में सारी editing खुद की और इतिहासकार की तरह सामग्री को जोड़ा
      बाद में agent experiment शुरू किए, तो काम की रफ़्तार बहुत बढ़ गई, लेकिन फिर भी क्या रखना है और क्या हटाना है इस पर सोचते हुए मैंने काफ़ी समय एक ‘wiki contributor’ की तरह बिताया
      साथ ही, इस अनुभव ने मुझे personal data protection की अहमियत बहुत गहराई से महसूस कराई। हम अपने बहुत ज़्यादा digital traces छोड़ रहे हैं
    • आम तौर पर इंसानों की नकल करने वाला AI मुझे असहज करता है, लेकिन इस बार ऐसा नहीं लगा
      Steve Jobs के कहे ‘bicycle for the mind’ की तरह, तकनीक ने इंसानी काम में मदद करने वाले tool की भूमिका निभाई
      काफ़ी समय बाद तकनीक को मानवीय रचनात्मकता में मदद करते देख कर पुराना उत्साह फिर महसूस हुआ
    • मेरा भी कुछ ऐसा ही मानना है। परिवार के इतिहास को संभालने के लिए framing device के रूप में यह शानदार है, लेकिन AI का कथावाचक बन जाना मुझे सहज रूप से खटकता है
      LLM का जानकारी को व्यवस्थित करना नैतिक रूप से समस्या नहीं है, लेकिन किसी बड़ी कंपनी के model का किसी व्यक्ति की कथा को उसकी ओर से कहना असहज करता है
    • यहाँ AI बस एक collaborator जैसा लगा
      लेखक ने दिलचस्प हिस्से संभाले और AI ने उबाऊ data-linking का काम किया; मुझे लगता है ऐसा role split आदर्श है
    • मेरी भी यही प्रतिक्रिया थी। परिवार के सदस्यों और घटनाओं को सीधे दर्ज करना बहुत अच्छा है, लेकिन अगर AI सब कुछ अपने आप कर दे तो उसका आकर्षण खत्म हो जाता है
      1. curation का स्पर्श गायब हो जाता है
      2. यादों की subjectivity महत्वपूर्ण है, लेकिन AI उसे सुधारने की कोशिश करता है
      3. अंत में यह बेजान नतीजा बन जाता है
  • मैं और मेरी पत्नी हर नए साल पर लगभग 50 पन्नों को बाँधकर एक छोटी notebook बनाते हैं
    हम घिसे हुए कपड़े से उसकी binding करते हैं और यात्रा की माचिस की डिब्बियों जैसी यादगार चीज़ों से सजाते हैं
    साल भर में सीखी बातें, झगड़े और सुलह, cooking recipes, विचार वगैरह लिखकर उसे उस साल का दस्तावेज़ बना देते हैं
    हम AI tools की जगह हाथ से लिखते हैं, क्योंकि यह प्रक्रिया अपने आप में एक अर्थपूर्ण और सुखद ritual है
    बाद में बच्चे इसे पढ़ेंगे, यह सोचकर यह और भी सुंदर लगता है

    • मैं भी कुछ ऐसा ही करता/करती हूँ; Instax printer से फोटो print करके diary में चिपकाता/चिपकाती हूँ
      पुराने, हाथों के इस्तेमाल से घिसे recipe book की तरह, रंग के छींटों वाले पन्नों वाली किताब ज़्यादा आकर्षक लगती है
    • इसे commonplace book कहा जाता है। Jillian Hess ने इस पर काफ़ी शोध किया है
    • यह सचमुच शानदार idea है, मैं इसे अपनी पत्नी और बच्चों के साथ आज़माना चाहूँगा/चाहूँगी
    • यह भावुक कर देने वाला है, लेकिन सच कहूँ तो शायद मेरे पास इतनी energy नहीं है
  • मैंने भी ऐसा काम एक असली printed book के रूप में शुरू किया है
    हज़ारों photos को Scribus में edit करके साल-दर-साल किताबें बना रहा/रही हूँ
    यह अच्छा लगता है कि मेरे जाने के बाद भी मेरे निशान किसी भौतिक रूप में बचे रहेंगे
    मैं शुरुआत में एक SD card लगाकर videos भी साथ छोड़ने वाला/वाली हूँ
    और, मैंने एक पुराना Canon Selphy printer भी लिया है और घर पर photos print करता/करती हूँ। रंग पूरी तरह परफ़ेक्ट नहीं हैं, लेकिन उन्हें दीवार पर टाँगकर संतोष होता है

    • मुझे zine बनाना पसंद है। laser print धूप में भी ज़्यादा चलता है, और pencil सबसे लंबे समय तक टिकती है
      360-degree stapler तेज़ binding के लिए बेहतरीन है
    • मैं कुछ ऐसा email के ज़रिए करता/करती हूँ। जब मेरा बेटा पैदा हुआ तो मैंने उसके नाम से एक email address बनाया और परिवारवालों से कहा कि वे उसे message और photo भेजें
      यह एक digital legacy project है, ताकि 18 साल का होने पर वह उन्हें पढ़ सके
      संबंधित लेख यहाँ है
    • किताब बनाने की लागत जानने की जिज्ञासा है। खुद बनाओ तो सस्ती पड़ती है, लेकिन आजकल समय की कमी है
    • मैं भी यह आज़माना चाहता/चाहती हूँ। क्या आप template या tips साझा कर सकते हैं?
    • मैंने सुना है कि SD card ज़्यादा लंबे समय तक नहीं टिकते। कुछ videos को flipbook के रूप में छोड़ना कैसा रहेगा?
  • मुझे genealogy research पसंद है। मैंने लगभग 10 पीढ़ी (करीब 250 साल) पहले Argentina आए अपने पूर्वजों का पता लगाया है
    यूरोप की ओर का हिस्सा युद्ध और दस्तावेज़ों के खो जाने की वजह से काफ़ी मुश्किल है
    हाल में मैं परिवार के बुज़ुर्गों से voice messages में पुरानी कहानियाँ लेकर उन्हें व्यवस्थित कर रहा/रही हूँ
    मेरे पिता द्वारा बनाई गई family tree के साथ इसे wiki format में व्यवस्थित करना अच्छा रहेगा

    • 10 पीढ़ियाँ तो कमाल है। जिज्ञासा है, आपके पूर्वज मूल रूप से किस देश से थे?
  • हर साल मेरी पत्नी हमारे shared account की photos चुनकर 50 पन्नों की किताब बनाती है
    अब तक 12 साल के annual records इकट्ठा हो चुके हैं, और वे हाथ से पलटकर देखने लायक यादें बन गए हैं
    वह यह काम दूसरे लोगों के लिए भी करती है, और उसके personal touch की वजह से लोगों की प्रतिक्रिया बहुत अच्छी रहती है

  • प्रोजेक्ट अपने आप में शानदार है, लेकिन LLM API इस्तेमाल करते समय privacy अहम है
    मैं अपनी photos किसी अमेरिकी कंपनी के model को नहीं देना चाहूँगा/चाहूँगी

    • confer.to जैसा एक विकल्प है
    • photos से ज़्यादा bank records की चिंता है
    • लेखक ने पहले ही blog में photos सार्वजनिक कर दी हैं, इसलिए लगता है वह उन्हें गोपनीय नहीं मानते
    • शायद PPQ.AI, OpenRouter.AI, या Apple on-device AI जैसे विकल्प हो सकते हैं
    • तो फिर क्या आप चीन, रूस या यूरोप की कंपनियों के LLM को यह सौंप पाएँगे?
  • family interviews और LLM workflow का संयोजन वाकई एक अच्छा use case है
    लेकिन Google Maps location history, Uber, bank transactions, Shazam तक export करना मुझे हद पार करने जैसा लगा
    आजकल बहुत-से AI projects कहते हैं कि “data आपके device में ही है,” लेकिन असल में data किस रास्ते से जाता है यह साफ़ नहीं होता
    मुझे लगता है कि users इस trade-off को पूरी तरह नहीं समझते

  • भले ही इसे “default private” कहा जाए, असल में data AI company के servers पर upload होता है
    अगर local LLM support नहीं है, तो privacy wording और स्पष्ट होनी चाहिए

  • Google Maps, Uber, bank, और Shazam data को AI को देने वाली बात मुझे असहज लगी
    प्रोजेक्ट शानदार है, लेकिन सबसे संवेदनशील data किसी service को सौंपना जोखिम भरा है
    कभी न कभी leak होने की संभावना हमेशा रहती है

    • मुझे असहज नहीं लगा। बस इस तरह की self-data obsession (quantified self) में मेरी दिलचस्पी नहीं है
      परिवार की कहानियों को संरक्षित करने में रुचि है, खुद के analysis में नहीं
  • idea अच्छा है, लेकिन सवाल यह है कि कितना share किया जाए
    अगर सिर्फ़ खुद देखना हो तो सब कुछ दर्ज किया जा सकता है, लेकिन परिवार के साथ देखने पर संवेदनशील कहानियाँ सामने आती हैं

    • सहमत। ऊपर से वह सब Anthropic servers पर चला जाता है
      परिवार के अँधेरे अतीत या आपसी संघर्ष तक को दर्ज करना privacy invasion हो सकता है
      युद्ध, जेल, विरासत के विवाद जैसी चीज़ों को लेकर हर व्यक्ति की यादें और भावनाएँ अलग होती हैं
      AI अगर इन्हें जोड़ता है, तो सिर्फ़ वस्तुनिष्ठता का भ्रम बचता है, और परिवार के घाव फिर से खुल सकते हैं
      अंततः मुझे लगता है कि यादों का स्वाभाविक भूल जाने का जीवनचक्र होना चाहिए
      तकनीक में डूबे लोग अक्सर ऐसी मानवीय जटिलताओं को नज़रअंदाज़ कर देते हैं
    • आख़िरकार यह मेरा wiki है, इसलिए मैं जैसा चाहूँ वैसा करूँगा/करूँगी