व्यक्तिगत विश्वकोश
(whoami.wiki)- दादी के घर में मिली 1,351 पारिवारिक तस्वीरों को व्यवस्थित करते समय यादों को संरचित करने के लिए MediaWiki-आधारित निजी wiki बनाया गया
- wiki फ़ॉर्मैट में तस्वीरों, लोगों और घटनाओं को जोड़ते हुए पारिवारिक और व्यक्तिगत इतिहास को लेखों के रूप में फिर से निर्मित किया गया
- इसके बाद Google Photos, लोकेशन हिस्ट्री, वित्तीय लेनदेन, म्यूज़िक पहचान डेटा जैसी विभिन्न डिजिटल छापों को जोड़कर Claude Code और language model से स्वतः पेज जनरेशन का प्रयोग किया गया
- इस प्रक्रिया में मॉडल ने यादों के खाली हिस्सों को पुनर्स्थापित किया और बातचीत, यात्राओं व दोस्ती के प्रवाह को डेटा-आधारित कथा में पुनर्गठित किया
- नतीजतन यह whoami.wiki open source project के रूप में विकसित हुआ, जो एक ऐसी प्रणाली प्रस्तुत करता है जिसमें व्यक्ति अपने डेटा को विश्वकोश की तरह खोज और स्वामित्व में रख सकता है
व्यक्तिगत विश्वकोश परियोजना की शुरुआत
- महामारी के बाद पहली बार दादी के घर जाकर 1,351 पुरानी तस्वीरें मिलीं और उन्हें व्यवस्थित करने का काम शुरू किया गया
- इन तस्वीरों में दादा-दादी की युवावस्था से लेकर लेखक के मिडिल स्कूल के समय तक की झलकें शामिल थीं
- शुरुआती वर्गीकरण फ़िल्म के प्रकार या फोटो अनुपात जैसी भौतिक विशेषताओं के आधार पर किया गया
- तस्वीरों को व्यवस्थित करते हुए यादों के बिखरे हुए किस्से उभरते रहे, लेकिन उनका क्रम और संदर्भ स्पष्ट नहीं था
- EXIF metadata से पहले के दौर की तस्वीरें होने के कारण समय-क्रम समझना कठिन था
- दादी के साथ तस्वीरों को फिर से सजाते हुए शादी के समय की यादों को मौखिक रूप में दर्ज किया गया
- लोगों के नाम और घटनाएँ नोट की गईं, और कुछ की पहचान रिश्तेदारों के युवा दिनों की तस्वीरों के रूप में हुई
- इन रिकॉर्ड्स को व्यवस्थित कर MediaWiki को लोकल पर चलाया गया और वास्तविक Wikipedia शैली में संपादन किया गया
- infobox, मुख्य पाठ, फोटो caption, व्यक्ति लिंक आदि सहित संरचित पेज लिखे गए
- संबंधित कानूनी संशोधन, रीति-रिवाज, स्थान आदि को वास्तविक Wikipedia पेजों से जोड़ा गया
wiki software के ज़रिए यादों का पुनर्निर्माण
- सिर्फ दो दिनों में तस्वीरों की ऐतिहासिक पृष्ठभूमि को पूर्ण लेखों के रूप में व्यवस्थित कर लिया गया
- इससे महसूस हुआ कि wiki software ज्ञान और media को संरक्षित करने का एक शक्तिशाली साधन है
- इसके बाद कई महीनों तक पूरे पारिवारिक फोटो संग्रह को wiki पेजों में विस्तारित किया गया
- r/genealogy community की सलाह से मौखिक इतिहास दर्ज करने का तरीका बेहतर किया गया
- voice transcription और language model का उपयोग कर संपादन दक्षता बढ़ाई गई
- wiki फ़ॉर्मैट की वजह से घटनाओं और व्यक्तियों के बीच संबंध आसानी से समझ में आए
- उदाहरण के लिए, यह पता चला कि दादा-दादी की शादी में गाने वाली गायिका वही नर्स थीं जिन्होंने लेखक का जन्म कराया था
डिजिटल डेटा और language model का संयोजन
- इसके बाद इसे Google Photos की डिजिटल तस्वीरों तक विस्तारित किया गया
- EXIF metadata की मदद से तारीख, समय और स्थान की जानकारी का उपयोग संभव हुआ
- 2012 की एक पारिवारिक यात्रा की 625 तस्वीरों के आधार पर Claude Code से wiki पेज बनाने को कहा गया
- ImageMagick से बनाई गई contact sheet के आधार पर इमेज ब्राउज़ की गईं
- मॉडल ने सिर्फ दृश्य जानकारी और timestamp के आधार पर स्थानों और गतिविधियों का पुनर्निर्माण किया
- इसमें परिवहन के साधन, घूमे गए स्थान और व्यक्तियों की पहचान जैसी विस्तृत बातें शामिल थीं
- तैयार मसौदे में लेखक की व्यक्तिगत घटनाओं की सूची जोड़कर कथा को पूरा किया गया
बहु-स्रोत डेटा एकीकरण का प्रयोग
- इसके बाद 2022 की Mexico City यात्रा के डेटा पर विस्तार किया गया
- 291 तस्वीरें, 343 वीडियो, Google Maps लोकेशन हिस्ट्री, Uber यात्रा, बैंक लेनदेन, Shazam रिकॉर्ड को एकीकृत किया गया
- Claude Code द्वारा किए गए प्रमुख कार्य
- बैंक लेनदेन और लोकेशन डेटा का cross-analysis कर जाकर खाए गए रेस्तरां की पहचान
- टिकट भुगतान रिकॉर्ड से फुटबॉल मैच की टीमों और प्रतियोगिता के नाम की पहचान
- Uber यात्रा रिकॉर्ड से यात्रा समय और स्थान का पता लगाना
- Shazam रिकॉर्ड से अलग-अलग स्थानों के संगीत genre का वर्णन
- रात के खाने के दौरान गिटार बजाने वाले दृश्य को वीडियो फ्रेम में ढूंढकर पेज में शामिल करना
- MediaWiki के discussion page, category, revision history फीचर्स का वैसा ही उपयोग किया गया
- हर नए डेटा जुड़ने पर वास्तविक wiki editor की तरह संशोधन इतिहास जमा होता गया
व्यक्तिगत डेटा का विश्वकोशीकरण
- समय के साथ मॉडल की भूमिका यादों के खालीपन को भरने की ओर बदल गई
- मॉडल ने कई डेटा स्रोतों का cross-analysis करके भूले हुए तथ्यों को पुनर्स्थापित किया
- Facebook, Instagram, WhatsApp archives के लगभग 1 लाख संदेशों और voice notes का विश्लेषण किया गया
- दोस्तों के साथ हुई बातचीत से दोस्ती के प्रवाह और जीवन की घटनाओं को निकालकर पेज बनाए गए
- दोस्तों ने वे पेज पढ़कर पूरी सामग्री में डूब जाने लायक रुचि दिखाई
- इस प्रक्रिया के माध्यम से यह सिर्फ पारिवारिक इतिहास की परियोजना नहीं रही, बल्कि personal encyclopedia बनाने की दिशा में विकसित हुई
- डेटा-आधारित, संरचित और परस्पर जुड़ी आत्म-रिकॉर्ड प्रणाली पूरी हुई
whoami.wiki project का सार्वजनिक विमोचन
- इसी अनुभव के आधार पर whoami.wiki को open source के रूप में जारी किया गया
- MediaWiki-आधारित, जो व्यक्तिगत डेटा से wiki पेज स्वतः बनाता है
- उपयोगकर्ता अपना data export देते हैं और language model मसौदा तैयार करता है
- लोकल रन, डेटा स्वामित्व बनाए रखना, और model independence सुनिश्चित करना
- किसी व्यक्ति की शादी, दोस्त, यात्रा जैसे सभी विषयों को public wiki जैसे ही फ़ॉर्मैट में दर्ज किया जा सकता है
- तैयार पेजों को एक्सप्लोर करने का अनुभव शुरुआती Facebook timeline जैसी खुशी देता है
- तकनीक से भी अधिक महत्वपूर्ण है लोगों और यादों की नई खोज
- दादी के जीवन को दर्ज करते हुए उनकी मजबूती और resilience को नए सिरे से पहचाना गया
- दोस्तों के साथ रिश्तों को पलटकर देखते हुए कृतज्ञता और जुड़ाव की भावना फिर से मिली
- परियोजना अभी शुरुआती चरण में है, और कोई भी installation documents के जरिए इसे खुद शुरू कर सकता है
- डेटा उपयोगकर्ता के स्वामित्व में रहता है, और संरचना ऐसी है जिसे कोई भी model पढ़ सकता है
- सहयोगियों के feedback के आधार पर इसे लगातार बेहतर बनाया जा रहा है
1 टिप्पणियां
Hacker News की राय
मुझे लगता है यह प्रोजेक्ट वाकई शानदार है और परिवार के इतिहास को संरक्षित करने का एक दिलचस्प तरीका है
लेकिन जहाँ AI शामिल हुआ, वहाँ इसे लेकर मेरी भावनाएँ थोड़ी जटिल रहीं
इसमें कुछ कड़वाहट थी, जैसे किसी कारीगर के हाथ का काम फैक्टरी से पीछे छूट रहा हो, और साथ ही AI का बैंक रिकॉर्ड, टिकट और संगीत इतिहास तक cross-analysis करना थोड़ा dystopian भी लगा
फिर भी, कुल मिलाकर यह बेहद प्रभावशाली प्रयास था
मैंने भी शुरुआत में सारी editing खुद की और इतिहासकार की तरह सामग्री को जोड़ा
बाद में agent experiment शुरू किए, तो काम की रफ़्तार बहुत बढ़ गई, लेकिन फिर भी क्या रखना है और क्या हटाना है इस पर सोचते हुए मैंने काफ़ी समय एक ‘wiki contributor’ की तरह बिताया
साथ ही, इस अनुभव ने मुझे personal data protection की अहमियत बहुत गहराई से महसूस कराई। हम अपने बहुत ज़्यादा digital traces छोड़ रहे हैं
Steve Jobs के कहे ‘bicycle for the mind’ की तरह, तकनीक ने इंसानी काम में मदद करने वाले tool की भूमिका निभाई
काफ़ी समय बाद तकनीक को मानवीय रचनात्मकता में मदद करते देख कर पुराना उत्साह फिर महसूस हुआ
LLM का जानकारी को व्यवस्थित करना नैतिक रूप से समस्या नहीं है, लेकिन किसी बड़ी कंपनी के model का किसी व्यक्ति की कथा को उसकी ओर से कहना असहज करता है
लेखक ने दिलचस्प हिस्से संभाले और AI ने उबाऊ data-linking का काम किया; मुझे लगता है ऐसा role split आदर्श है
मैं और मेरी पत्नी हर नए साल पर लगभग 50 पन्नों को बाँधकर एक छोटी notebook बनाते हैं
हम घिसे हुए कपड़े से उसकी binding करते हैं और यात्रा की माचिस की डिब्बियों जैसी यादगार चीज़ों से सजाते हैं
साल भर में सीखी बातें, झगड़े और सुलह, cooking recipes, विचार वगैरह लिखकर उसे उस साल का दस्तावेज़ बना देते हैं
हम AI tools की जगह हाथ से लिखते हैं, क्योंकि यह प्रक्रिया अपने आप में एक अर्थपूर्ण और सुखद ritual है
बाद में बच्चे इसे पढ़ेंगे, यह सोचकर यह और भी सुंदर लगता है
पुराने, हाथों के इस्तेमाल से घिसे recipe book की तरह, रंग के छींटों वाले पन्नों वाली किताब ज़्यादा आकर्षक लगती है
मैंने भी ऐसा काम एक असली printed book के रूप में शुरू किया है
हज़ारों photos को Scribus में edit करके साल-दर-साल किताबें बना रहा/रही हूँ
यह अच्छा लगता है कि मेरे जाने के बाद भी मेरे निशान किसी भौतिक रूप में बचे रहेंगे
मैं शुरुआत में एक SD card लगाकर videos भी साथ छोड़ने वाला/वाली हूँ
और, मैंने एक पुराना Canon Selphy printer भी लिया है और घर पर photos print करता/करती हूँ। रंग पूरी तरह परफ़ेक्ट नहीं हैं, लेकिन उन्हें दीवार पर टाँगकर संतोष होता है
360-degree stapler तेज़ binding के लिए बेहतरीन है
यह एक digital legacy project है, ताकि 18 साल का होने पर वह उन्हें पढ़ सके
संबंधित लेख यहाँ है
मुझे genealogy research पसंद है। मैंने लगभग 10 पीढ़ी (करीब 250 साल) पहले Argentina आए अपने पूर्वजों का पता लगाया है
यूरोप की ओर का हिस्सा युद्ध और दस्तावेज़ों के खो जाने की वजह से काफ़ी मुश्किल है
हाल में मैं परिवार के बुज़ुर्गों से voice messages में पुरानी कहानियाँ लेकर उन्हें व्यवस्थित कर रहा/रही हूँ
मेरे पिता द्वारा बनाई गई family tree के साथ इसे wiki format में व्यवस्थित करना अच्छा रहेगा
हर साल मेरी पत्नी हमारे shared account की photos चुनकर 50 पन्नों की किताब बनाती है
अब तक 12 साल के annual records इकट्ठा हो चुके हैं, और वे हाथ से पलटकर देखने लायक यादें बन गए हैं
वह यह काम दूसरे लोगों के लिए भी करती है, और उसके personal touch की वजह से लोगों की प्रतिक्रिया बहुत अच्छी रहती है
प्रोजेक्ट अपने आप में शानदार है, लेकिन LLM API इस्तेमाल करते समय privacy अहम है
मैं अपनी photos किसी अमेरिकी कंपनी के model को नहीं देना चाहूँगा/चाहूँगी
family interviews और LLM workflow का संयोजन वाकई एक अच्छा use case है
लेकिन Google Maps location history, Uber, bank transactions, Shazam तक export करना मुझे हद पार करने जैसा लगा
आजकल बहुत-से AI projects कहते हैं कि “data आपके device में ही है,” लेकिन असल में data किस रास्ते से जाता है यह साफ़ नहीं होता
मुझे लगता है कि users इस trade-off को पूरी तरह नहीं समझते
भले ही इसे “default private” कहा जाए, असल में data AI company के servers पर upload होता है
अगर local LLM support नहीं है, तो privacy wording और स्पष्ट होनी चाहिए
Google Maps, Uber, bank, और Shazam data को AI को देने वाली बात मुझे असहज लगी
प्रोजेक्ट शानदार है, लेकिन सबसे संवेदनशील data किसी service को सौंपना जोखिम भरा है
कभी न कभी leak होने की संभावना हमेशा रहती है
परिवार की कहानियों को संरक्षित करने में रुचि है, खुद के analysis में नहीं
idea अच्छा है, लेकिन सवाल यह है कि कितना share किया जाए
अगर सिर्फ़ खुद देखना हो तो सब कुछ दर्ज किया जा सकता है, लेकिन परिवार के साथ देखने पर संवेदनशील कहानियाँ सामने आती हैं
परिवार के अँधेरे अतीत या आपसी संघर्ष तक को दर्ज करना privacy invasion हो सकता है
युद्ध, जेल, विरासत के विवाद जैसी चीज़ों को लेकर हर व्यक्ति की यादें और भावनाएँ अलग होती हैं
AI अगर इन्हें जोड़ता है, तो सिर्फ़ वस्तुनिष्ठता का भ्रम बचता है, और परिवार के घाव फिर से खुल सकते हैं
अंततः मुझे लगता है कि यादों का स्वाभाविक भूल जाने का जीवनचक्र होना चाहिए
तकनीक में डूबे लोग अक्सर ऐसी मानवीय जटिलताओं को नज़रअंदाज़ कर देते हैं