1 पॉइंट द्वारा GN⁺ 2024-05-30 | 1 टिप्पणियां | WhatsApp पर शेयर करें

AI हेडफ़ोन: भीड़ में सिर्फ एक व्यक्ति की आवाज़ सुनना

मुख्य बातें

  • रिसर्च की पृष्ठभूमि

    • noise-cancelling हेडफ़ोन खास आवाज़ों को ब्लॉक करने में बेहतरीन होते हैं.
    • लेकिन जब यूज़र सिर्फ किसी खास आवाज़ को सुनना चाहता है, तब इनकी सीमाएँ होती हैं.
  • नए सिस्टम का विकास

    • University of Washington की टीम ने "Target Speech Hearing" नाम का AI सिस्टम विकसित किया.
    • यूज़र हेडफ़ोन पहनकर 3~5 सेकंड तक किसी खास व्यक्ति की ओर देखे, तो वह सिर्फ उसी व्यक्ति की आवाज़ सुन सकता है.
    • यह सिस्टम यूज़र के हिलने-डुलने या दूसरी दिशा में देखने पर भी उस खास आवाज़ को सुनाता रहता है.
  • इस्तेमाल का तरीका

    • माइक्रोफ़ोन लगे सामान्य हेडफ़ोन पहनें, किसी खास व्यक्ति की ओर देखते हुए बटन दबाएँ.
    • हेडफ़ोन उस व्यक्ति की voice pattern सीख लेते हैं और बाकी आवाज़ों को ब्लॉक कर देते हैं.
    • सिस्टम यूज़र के हिलने पर भी उस खास आवाज़ को लगातार track करता है.
  • रिसर्च के नतीजे

    • 21 प्रतिभागियों ने सिस्टम की speech clarity का मूल्यांकन किया, और इसे मौजूदा audio की तुलना में दो गुना अधिक स्पष्ट बताया.
    • फिलहाल एक समय में सिर्फ एक व्यक्ति की आवाज़ ही रजिस्टर की जा सकती है, और अगर उसी दिशा से तेज़ आवाज़ आए तो रजिस्ट्रेशन मुश्किल हो जाता है.
  • भविष्य की योजना

    • सिस्टम को earbuds और hearing aids तक बढ़ाने की योजना है.

GN⁺ की राय

  • तकनीक की उपयोगिता

    • शोरभरे माहौल में किसी खास व्यक्ति की आवाज़ को साफ़ सुन पाना मीटिंग या लेक्चर जैसी स्थितियों में उपयोगी हो सकता है.
  • तकनीक की सीमाएँ

    • फिलहाल एक समय में सिर्फ एक व्यक्ति की आवाज़ रजिस्टर कर पाने की वजह से यह कुछ हद तक सीमित है.
    • उसी दिशा से तेज़ आवाज़ आने पर रजिस्ट्रेशन मुश्किल होना भी ऐसा बिंदु है जिसमें सुधार की ज़रूरत है.
  • तकनीक के विस्तार की संभावना

    • अगर इसे earbuds और hearing aids तक बढ़ाया जाता है, तो यह अधिक लोगों के लिए मददगार हो सकता है.
  • प्रतिस्पर्धी तकनीकें

    • समान फीचर देने वाली अन्य noise-cancelling तकनीकों के साथ इसकी तुलना ज़रूरी है.
  • व्यावहारिकता

    • वास्तविक commercial launch से पहले, रिसर्च चरण के प्रदर्शन और रोज़मर्रा के उपयोग में प्रदर्शन के अंतर को ध्यान में रखना होगा.

1 टिप्पणियां

 
GN⁺ 2024-05-30
Hacker News राय
  • अगर यह छोटा होकर ईयरप्लग के आकार का हो जाए, तो मैं, जिसे सुनने की कोई दिक्कत नहीं है, भी इसे इस्तेमाल करना चाहूँगा। व्यस्त रेस्टोरेंट या बार में बातचीत ठीक से सुनाई न देने की झुंझलाहट वाली स्थिति का समाधान हो सकता है।

  • हियरिंग एड डिवाइसों की महंगी कीमत और क्वालिटी की समस्या। सिर्फ बुनियादी sound amplification वाले डिवाइस भी बहुत महंगे होते हैं। साथ ही, ये कान में हस्तक्षेप करके दूसरी आवाज़ों को फ़िल्टर करने की क्षमता भी कम कर देते हैं।

  • Facebook की AR research सस्ती experimental platform उपलब्ध कराती है। इसमें eye tracking, microphone array और front camera है, इसलिए इसे आसानी से एडजस्ट होने वाले माइक्रोफ़ोन में बदला जा सकता है।

  • सुनने में दिक्कत वाले लोगों के लिए यह फीचर किसी वरदान जैसा है। उम्मीद है कि यह फीचर जल्द से जल्द हियरिंग एड डिवाइसों में इंटीग्रेट हो।

  • यह फीचर tinnitus के इलाज में मदद कर सकता है। जब एक व्यक्ति बोलता है तो मैं ठीक से सुन लेता हूँ, लेकिन कई लोग साथ बोलें या संगीत चल रहा हो तो कुछ भी सुनाई नहीं देता।

  • open source code और research paper के लिंक दिए गए हैं। जिज्ञासा है कि क्या इसे स्वतंत्र रूप से चलाया जा सकता है।

  • व्यावसायिक सफलता की संभावना। ज़रा सोचिए, अगर शोर मचाने वाले व्यक्ति की आवाज़ को mute किया जा सके।

  • Sonos में काम करते समय इसी तरह के फीचर पर रिसर्च हुई थी। ANC chipset के ज़रिए किसी खास व्यक्ति की आवाज़ ही सुनाई दे, ऐसा फीचर बनाने की कोशिश की गई थी।

  • कोड लिंक दिया गया है। (https://github.com/vb000/LookOnceToHear)

  • ADHD की वजह से व्यस्त कमरे में बातचीत करना मुश्किल होता है। ऐसा फीचर जो सिर्फ सामने वाले की आवाज़ सुनाए, बहुत उपयोगी हो सकता है।

  • ANC फीचर वाले हेडफ़ोन घर में उपयोगी हो सकते हैं। अच्छा होगा अगर उनमें पार्टनर की आवाज़ अपने-आप pass through करने का फीचर हो।