- AI voice assistant तकनीक के साथ इंटरैक्शन को क्रांतिकारी रूप से बदलते हैं, लेकिन मौजूदा voice assistant के साथ बातचीत अक्सर मशीन जैसी और असहज लग सकती है
- मानव बातचीत के सूक्ष्म और भावनात्मक पहलुओं को समझने और उनके अनुसार ढलने में कठिनाई होती है
- अगर एक पूरी तरह open voice assistant को इस तरह बनाया जाए तो कैसा होगा?
- जो real-time में user requests का जवाब दे, और जिसमें स्वाभाविक आवाज़, सहानुभूति और भावनात्मक बुद्धिमत्ता हो
- जो पिछली बातचीत के long-term context को समझे, और कई लोगों की बातचीत, interruptions, confirmations, और सोचने के लिए रुकने जैसी स्थितियों को भी संभाल सके
- जो consumer hardware पर पूरी तरह local रूप से काम करे
BUD-E (Buddy for Understanding and Digital Empathy) का विकास
- LAION ने ELLIS Institute Tübingen, Collabora, और Tübingen AI Center के साथ मिलकर BUD-E विकसित किया
- शुरुआत कम latency वाले एक बुनियादी voice assistant के विकास से हुई, और जनवरी 2024 तक 300~500ms की latency हासिल की गई
- उम्मीद है कि बड़े models का उपयोग करके 300ms से कम response time संभव होगा
BUD-E विकास रोडमैप
- बुनियादी model के साथ बातचीत भी अब तक देखी गई चीज़ों की तुलना में कहीं अधिक स्वाभाविक है
- लेकिन अभी भी कई समस्याएँ हल करनी हैं और कई features विकसित करने हैं
- latency कम करना और system requirements को न्यूनतम करना
- स्वाभाविक बातचीत और responses की प्राकृतिकता बढ़ाना
- कई दिनों, महीनों और वर्षों तक फैली बातचीत को track करना
- voice assistant की functionality और capabilities को बेहतर बनाना
- multimodal और भावनात्मक context की समझ को बेहतर करना
- user interface, continuous integration, और आसान packaging infrastructure बनाना
- multi-language और multi-speaker तक विस्तार करना
संवादात्मक AI के भविष्य के निर्माण के लिए सहयोग
- BUD-E का विकास एक सतत प्रक्रिया है, जिसके लिए विभिन्न communities के सामूहिक प्रयास की आवश्यकता है
- open source developers, researchers, और उत्साही लोगों को BUD-E के अलग-अलग modules को बेहतर बनाने और उसके विकास में योगदान देने के लिए आमंत्रित किया गया है
- आशा है कि हम मिलकर ऐसा AI voice assistant बना सकें जो स्वाभाविक, सहज और सहानुभूतिपूर्ण बातचीत कर सके
अभी कोई टिप्पणी नहीं है.