- अगर फ़ोन हमारी कही हर बात को हमेशा रिकॉर्ड करे और उसे AI से प्रोसेस करे, तो क्या होगा? मैंने पहले खुद यह करके देखा।
- सोने के समय को छोड़कर, जागते हुए लगभग हर समय रिकॉर्डिंग चालू रहती है (अनुचित स्थितियों में इसे बंद भी किया जाता है)। यह एक PoC है और अभी वास्तविक उपयोग में लाना मुश्किल है.
- इसे बनाने की प्रेरणा OpenAI के Whisper के सार्वजनिक होने से मिली।
यह कैसे काम करता है
- दो माइक्रोफ़ोन से पूरे दिन की बातचीत रिकॉर्ड की जाती है, और दिन खत्म होने पर उसे Whisper से प्रोसेस करके टेक्स्ट में बदला जाता है।
- इससे यह समझ आया कि "Ok Google" स्टाइल का एक शुरुआती स्तर का डिजिटल असिस्टेंट बनाया जा सकता है।
- हर दिन दो तरह की जानकारी निकाली जा सकती है.
- Active : वे चीज़ें जिन्हें मैं जानबूझकर असिस्टेंट को निर्देश देकर कराता हूँ।
- Passive : बाकी सारी जानकारी, जो बिना मेरे किसी अतिरिक्त action के अपने आप निकाली जानी चाहिए।
Active Functions
- जिन चीज़ों को हर शाम asynchronous तरीके से प्रोसेस किया जाना है, उनके लिए मैं
'KEYWORD COMMAND data END KEYWORD' फ़ॉर्मेट में बोलता हूँ।
'Robert WEIGHT 60.1 end Robert' : Robert असिस्टेंट का नाम है, और end समाप्ति keyword है।
- "OK Google" का उपयोग न करने के कारण: यह सीमित है, जानकारी Google तक जाने का विचार पसंद नहीं है, और यह बोलते ही तुरंत प्रोसेस होने वाला synchronous तरीका है।
- बेशक, क्योंकि यह asynchronous है, इसलिए दिन खत्म होने से पहले स्थिति का पता नहीं चल पाता—यह इसकी कमी है।
नतीजे देखना
- वज़न मशीन पर चढ़ने के बाद
'Robert WEIGHT 62.8 end Robert'
- सोकर उठने के बाद sleep tracker (Mi Band) को पढ़ना
'Robert SLEEP 7 hours 14 minutes end Robert'
- इलेक्ट्रॉनिक डिवाइस फ़ोन से जुड़कर जानकारी भेज तो देते हैं, लेकिन उसे बाहर निकालने का कोई तरीका नहीं है, इसलिए बस digital assistant को एक तरह के Analog API की तरह इस्तेमाल किया।
- खाना खाने के बाद
'Robert LUNCH two toasts with a fried egg end Robert'
- हर दिन खाए गए भोजन की calories का हिसाब external API से लगाया जाता है।
- पॉडकास्ट सुनने के बाद
'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
- notes और ideas सभी सेव किए जाते हैं।
- ईंधन भरवाने के बाद
'Robert SPENT 250,000 on fuel end Robert'
- हर दिन के खर्च का रिकॉर्ड सेव किया जाता है।
- खुद से इस तरह बात करना थोड़ा अजीब लगता है, लेकिन इसका फ़ायदा यह है कि फ़ोन उठाकर कुछ करने की ज़रूरत नहीं पड़ती।
कंट्रोल पैनल
- इस तरह दर्ज की गई सारी जानकारी देखने के लिए एक dashboard बनाया गया।
- My Journal बनाया गया, जो अपने आप रिकॉर्ड करता है कि मैंने आज पूरे दिन क्या किया।
Passive Information - अभी काम जारी है
- RELATIONSHIP THERMOMETER : रिश्तों का तापमान सूचक
- SENTIMENT ANALYSIS : भावनात्मक विश्लेषण
- TOTAL RECALL: किसी खास topic पर हुई सारी बातचीत खोजना, और उस topic पर किसी विशेष समय पर मेरे विचारों को ढूँढना
प्रारंभिक निष्कर्ष
- audio + context, दोनों की ज़रूरत है।
- इससे मिलने वाली संभावनाएँ सकारात्मक और नकारात्मक—दोनों तरफ़ से बहुत बड़ी हैं।
- सकारात्मक : perfect memory, निजी मनोवैज्ञानिक/कोच, मेरा virtual clone
- नकारात्मक : यही सब चीज़ें किसी और के हाथ में होना
- यूटोपिया और डिस्टोपिया के बीच का फ़र्क यह है कि उस जानकारी तक पहुँच किसकी है।
3 टिप्पणियां
“यूटोपिया और डिस्टोपिया के बीच का फ़र्क यह है कि उस जानकारी तक किसकी पहुँच हो सकती है।” अच्छी बात है।
आकर्षक है। यह काफ़ी हद तक वास्तविकता में बदलना संभव लगता है.
VLog की तरह कभी-कभी आदर्श रोज़मर्रा की ज़िंदगी को साझा करके बाँटने वाला कंटेंट भी संभव होगा.
HN पर इसे लेखक ने खुद पोस्ट किया है और वहाँ टिप्पणियाँ भी की हैं https://news.ycombinator.com/item?id=33608437
जिस माइक्रोफ़ोन का इस्तेमाल किया गया, उसका AliExpress लिंक भी शामिल है haha
Whisper - OpenAI द्वारा open source के रूप में जारी किया गया बहुभाषी speech recognition system (ASR)