Pi-C.A.R.D
विषय सूची
- परिचय
- उपयोग
- हार्डवेयर
- सेटअप
परिचय
- Pi-card एक AI-आधारित वॉइस असिस्टेंट है जो पूरी तरह Raspberry Pi पर चलता है.
- यह सामान्य बातचीत की सेटिंग में वे सभी काम कर सकता है जो ChatGPT जैसे मानक LLM कर सकते हैं.
- अगर कैमरा लगा हो, तो आप Pi-card से फोटो खींचने, जो वह देख रहा है उसे बताने, और उस इमेज के बारे में सवाल पूछने के लिए कह सकते हैं.
Pi-card क्यों?
- यह Raspberry Pi - C amera A udio R ecognition D evice का संक्षिप्त रूप है.
- अगर आप इससे बेहतर acronym सोच सकते हैं, तो issue या pull request सबमिट करने का अनुरोध किया गया है.
यह कैसे काम करता है?
- Pi-card पूरी तरह Raspberry Pi पर चलता है.
- जब main program चलाया जाता है, तो सिस्टम wake word सुनना शुरू कर देता है.
- wake word बोलते ही बातचीत शुरू हो जाती है, और बातचीत के दौरान wake word बार-बार दोहराने की जरूरत नहीं होती.
- जब तक आप "रुको", "बंद करो", "बाय" जैसी बातें नहीं कहते, यह कमांड सुनता रहता है.
- बातचीत के दौरान सिस्टम context बनाए रखता है, इसलिए पहले के विषयों को दोहरा सकता है या विस्तार से समझा सकता है.
- सिस्टम को पूरी तरह local में काम करने के लिए डिज़ाइन किया गया है, लेकिन बातचीत को बेहतर बनाने या बाहरी डिवाइस नियंत्रित करने के लिए बाहरी API या services जोड़ी जा सकती हैं.
- उदाहरण के लिए, अगर आप "फोटो खींचो" या "तुम क्या देख रहे हो" कहते हैं, तो कैमरा सक्रिय हो जाता है.
यह कितना उपयोगी है?
- यह सिस्टम एक मज़ेदार प्रोजेक्ट के रूप में बनाया गया है, और कुछ हद तक उपयोगी AI असिस्टेंट भी है.
- क्योंकि सभी काम local में होते हैं, इसलिए यह cloud-आधारित सिस्टम जितना तेज़ या सक्षम नहीं है.
- फिर भी इसमें सुधार की काफी गुंजाइश है.
ऐप क्यों नहीं?
- इसका उद्देश्य ऐसा वॉइस असिस्टेंट बनाना था जो पूरी तरह offline चले और जिसे internet connection की जरूरत न हो.
- इसका मकसद user privacy की रक्षा करना और user data को third-party servers पर भेजे जाने से रोकना है.
उपयोग
- repository डाउनलोड करने, requirements install करने और बाकी setup निर्देशों का पालन करने के बाद, आप नीचे दिए गए कमांड से main program चला सकते हैं:
python assistant.py
- प्रोग्राम चलने के बाद, आप wake word बोलकर असिस्टेंट से बातचीत शुरू कर सकते हैं.
- डिफ़ॉल्ट wake word "hey assistant" है, लेकिन इसे
config.py फ़ाइल में बदला जा सकता है.
हार्डवेयर
- Raspberry Pi 5 Model B
- USB माइक्रोफ़ोन
- स्पीकर
- कैमरा
सेटअप
सॉफ़्टवेयर
- सिस्टम को जितना संभव हो उतना तेज़ और हल्का रखने के लिए audio transcription और vision language model की cpp implementations का उपयोग किया गया है.
- audio transcription के लिए whipser.cpp library और vision language model के लिए llama.cpp library का उपयोग किया गया है.
- आपको हर repository को अपनी पसंद की जगह पर clone करना होगा और उनके paths को
config.py फ़ाइल में जोड़ना होगा.
- clone करने के बाद, हर repository में जाकर model चलाने के setup निर्देशों का पालन करें.
हार्डवेयर
- हार्डवेयर setup बहुत सरल है.
- आपको Raspberry Pi 5 Model B, USB माइक्रोफ़ोन, स्पीकर और कैमरा चाहिए.
- USB माइक्रोफ़ोन और स्पीकर को Raspberry Pi के USB ports में जोड़ा जा सकता है.
- कैमरा Raspberry Pi के camera port से जोड़ा जा सकता है.
- इस्तेमाल किया गया हार्डवेयर:
- Raspberry Pi 5 kit
- USB माइक्रोफ़ोन
- स्पीकर
- कैमरा
- कैमरा कनेक्टर
- Pi 5 में नया camera port है, इसलिए नया camera connector चाहिए.
GN⁺ की राय
- Pi-card, Raspberry Pi का उपयोग करने वाला एक दिलचस्प प्रोजेक्ट है, जो AI और हार्डवेयर के संयोजन से कई संभावनाओं को खोजता है.
- यह पूरी तरह offline काम करता है, इसलिए privacy protection के लिहाज़ से इसका बड़ा फायदा है.
- cloud-आधारित सिस्टम की तुलना में इसकी performance कम हो सकती है, लेकिन local में चलने की वजह से data security बेहतर होती है.
- मिलती-जुलती सुविधाएँ देने वाले दूसरे प्रोजेक्ट्स में Mycroft AI और Jasper शामिल हैं.
- इस तकनीक को अपनाते समय हार्डवेयर और सॉफ़्टवेयर setup थोड़ा जटिल हो सकता है, इसलिए पहले से अच्छी तैयारी ज़रूरी है.
अभी कोई टिप्पणी नहीं है.