LAION ने स्वाभाविक AI voice assistant के लिए मॉडल BUD-E जारी किया

xguru · 2024-02-13T10:41:01+09:00

AI voice assistant तकनीक के साथ इंटरैक्शन को क्रांतिकारी रूप से बदलते हैं, लेकिन मौजूदा voice assistant के साथ बातचीत अक्सर मशीन जैसी और असहज लग सकती है मानव बातचीत के सूक्ष्म और भावनात्मक पहलुओं को समझने और उनके अनुसार ढलने में कठिनाई होती है अगर एक पूरी तरह open voice assistant को इस तरह बनाया जाए तो कैसा होगा? जो real-time में user requests का जवाब दे, और जिसमें स्वाभाविक आवाज़, सहानुभूति और भावनात्मक बुद्धिमत्ता हो जो पिछली बातचीत के long-term context को समझे, और कई लोगों की बातचीत, interruptions, confirmations, और सोचने के लिए रुकने जैसी स्थितियों को भी संभाल सके जो consumer hardware पर पूरी तरह local रूप से काम करे BUD-E (Buddy for Understanding and Digital Empathy) का विकास LAION ने ELLIS Institute Tübingen, Collabora, और Tübingen AI Center के साथ मिलकर BUD-E विकसित किया शुरुआत कम latency वाले एक बुनियादी voice assistant के विकास से हुई, और जनवरी 2024 तक 300~500ms की latency हासिल की गई उम्मीद है कि बड़े models का उपयोग करके 300ms से कम response time संभव होगा BUD-E विकास रोडमैप बुनियादी model के साथ बातचीत भी अब तक देखी गई चीज़ों की तुलना में कहीं अधिक स्वाभाविक है लेकिन अभी भी कई समस्याएँ हल करनी हैं और कई features विकसित करने हैं latency कम करना और system requirements को न्यूनतम करना स्वाभाविक बातचीत और responses की प्राकृतिकता बढ़ाना कई दिनों, महीनों और वर्षों तक फैली बातचीत को track करना voice assistant की functionality और capabilities को बेहतर बनाना multimodal और भावनात्मक context की समझ को बेहतर करना user interface, continuous integration, और आसान packaging infrastructure बनाना multi-language और multi-speaker तक विस्तार करना संवादात्मक AI के भविष्य के निर्माण के लिए सहयोग BUD-E का विकास एक सतत प्रक्रिया है, जिसके लिए विभिन्न communities के सामूहिक प्रयास की आवश्यकता है open source developers, researchers, और उत्साही लोगों को BUD-E के अलग-अलग modules को बेहतर बनाने और उसके विकास में योगदान देने के लिए आमंत्रित किया गया है आशा है कि हम मिलकर ऐसा AI voice assistant बना सकें जो स्वाभाविक, सहज और सहानुभूतिपूर्ण बातचीत कर सके

(laion.ai)

4 पॉइंट द्वारा xguru 2024-02-13 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

AI voice assistant तकनीक के साथ इंटरैक्शन को क्रांतिकारी रूप से बदलते हैं, लेकिन मौजूदा voice assistant के साथ बातचीत अक्सर मशीन जैसी और असहज लग सकती है
मानव बातचीत के सूक्ष्म और भावनात्मक पहलुओं को समझने और उनके अनुसार ढलने में कठिनाई होती है
अगर एक पूरी तरह open voice assistant को इस तरह बनाया जाए तो कैसा होगा?
- जो real-time में user requests का जवाब दे, और जिसमें स्वाभाविक आवाज़, सहानुभूति और भावनात्मक बुद्धिमत्ता हो
- जो पिछली बातचीत के long-term context को समझे, और कई लोगों की बातचीत, interruptions, confirmations, और सोचने के लिए रुकने जैसी स्थितियों को भी संभाल सके
- जो consumer hardware पर पूरी तरह local रूप से काम करे

BUD-E (Buddy for Understanding and Digital Empathy) का विकास

LAION ने ELLIS Institute Tübingen, Collabora, और Tübingen AI Center के साथ मिलकर BUD-E विकसित किया
शुरुआत कम latency वाले एक बुनियादी voice assistant के विकास से हुई, और जनवरी 2024 तक 300~500ms की latency हासिल की गई
उम्मीद है कि बड़े models का उपयोग करके 300ms से कम response time संभव होगा

BUD-E विकास रोडमैप

बुनियादी model के साथ बातचीत भी अब तक देखी गई चीज़ों की तुलना में कहीं अधिक स्वाभाविक है
लेकिन अभी भी कई समस्याएँ हल करनी हैं और कई features विकसित करने हैं
- latency कम करना और system requirements को न्यूनतम करना
- स्वाभाविक बातचीत और responses की प्राकृतिकता बढ़ाना
- कई दिनों, महीनों और वर्षों तक फैली बातचीत को track करना
- voice assistant की functionality और capabilities को बेहतर बनाना
- multimodal और भावनात्मक context की समझ को बेहतर करना
- user interface, continuous integration, और आसान packaging infrastructure बनाना
- multi-language और multi-speaker तक विस्तार करना

संवादात्मक AI के भविष्य के निर्माण के लिए सहयोग

BUD-E का विकास एक सतत प्रक्रिया है, जिसके लिए विभिन्न communities के सामूहिक प्रयास की आवश्यकता है
open source developers, researchers, और उत्साही लोगों को BUD-E के अलग-अलग modules को बेहतर बनाने और उसके विकास में योगदान देने के लिए आमंत्रित किया गया है
आशा है कि हम मिलकर ऐसा AI voice assistant बना सकें जो स्वाभाविक, सहज और सहानुभूतिपूर्ण बातचीत कर सके

LAION ने स्वाभाविक AI voice assistant के लिए मॉडल BUD-E जारी किया

BUD-E (Buddy for Understanding and Digital Empathy) का विकास

BUD-E विकास रोडमैप

संवादात्मक AI के भविष्य के निर्माण के लिए सहयोग

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.