- ChatGPT में नई voice और image सुविधाएँ जारी की गई हैं.
- अब voice के ज़रिए स्वाभाविक बातचीत करना और image attach करके सवाल पूछना संभव है.
- voice को Whisper के ज़रिए text में बदला जाता है, और जवाबों को नए TTS model के आधार पर पेशेवर voice actor की आवाज़ में बदला जाता है.
- नया TTS model सिर्फ कुछ सेकंड के sample voice से भी उसी व्यक्ति की आवाज़ को काफ़ी सटीक रूप से दोहरा सकता है.
- यह model Spotify के podcast translation फीचर में भी इस्तेमाल होता है, जहाँ podcaster की अपनी आवाज़ को बनाए रखते हुए कई भाषाओं में अनुवाद किया जाता है.
- एक बार में कई images attach की जा सकती हैं, और यह image के भीतर के text के साथ-साथ objects को भी विस्तार से पहचान सकता है.
- आप किसी tool या device के इस्तेमाल का तरीका पूछ सकते हैं, या fridge में मौजूद ingredients के आधार पर recipe पर बातचीत कर सकते हैं.
- इसके अलावा graph का analysis करना या math problems हल करना भी संभव है.
- mobile app में drawing tool के ज़रिए image के किसी खास हिस्से पर ध्यान केंद्रित कराया जा सकता है.
- सुरक्षा और privacy के लिए लोगों के बारे में analysis करने या उन पर बात करने की क्षमता काफ़ी सीमित रखी गई है.
- यह अगले 2 हफ्तों के भीतर पहले Plus और Enterprise users को उपलब्ध कराया जाएगा.
- voice सिर्फ iOS और Android पर काम करेगी, जबकि image attach फीचर सभी platforms पर उपलब्ध है.
4 टिप्पणियां
स्काईनेट आ रहा है...
लगता है कि फिल्म her जैसा OS अब संभव हो जाएगा
जब GPT-4 पहली बार रिलीज़ हुआ था तब यह थोड़ी देर के लिए सामने आया था, लेकिन इमेज को पहचानने से आगे बढ़कर उन्हें समझना वाकई बहुत हैरान करने वाला है।
उदाहरणों में एक हिस्सा आता है जहाँ साइकिल की सीट को कैसे एडजस्ट करना है, यह पूछा जाता है,
और यह सिर्फ साधारण इमेज रिकग्निशन नहीं लग रहा, बल्कि जैसे मैनुअल देखकर सही टूल ढूँढकर दे रहा हो...
मुझे लगा था शायद Plus सब्सक्रिप्शन की ज़रूरत होगी, लेकिन अगर ऐसा है तो बात थोड़ी अलग हो जाती है... बहुत उत्सुकता हो रही है।
HN थ्रेड का AI सारांश