• टेक्स्ट, ऑडियो और इमेज को एक साथ प्रोसेस और जनरेट कर सकने वाला एक क्रांतिकारी AI मॉडल
• इंसानी बातचीत के बराबर रियल-टाइम रिस्पॉन्स टाइम के साथ, GPT-4o प्राकृतिक human-computer interaction के लिए एक नया मानक स्थापित करता है
• API में अधिक तेज़ और लागत-कुशल होने के साथ-साथ, टेक्स्ट और कोड में, खासकर गैर-अंग्रेज़ी भाषाओं में, GPT-4 Turbo के प्रदर्शन से बेहतर
• GPT-4o की मल्टीमोडल क्षमताओं के जरिए यह ऑडियो इनपुट को समझ सकता है और उसका जवाब दे सकता है, ऑडियो आउटपुट जनरेट कर सकता है, और रियल-टाइम बातचीत में भाग ले सकता है
• यह मॉडल बेहतर reasoning, बहुभाषी दक्षता, ऑडियो और विज़ुअल समझ, तथा विज़ुअल perception दिखाता है
• OpenAI ने संभावित जोखिमों को कम करने के लिए GPT-4o की डिज़ाइन और post-training में लागू किए गए सुरक्षा उपायों पर ज़ोर दिया
• शुरुआती रिलीज़ में टेक्स्ट और इमेज इनपुट तथा टेक्स्ट आउटपुट शामिल हैं, जबकि ऑडियो और वीडियो क्षमताएँ भविष्य में API के विश्वसनीय पार्टनर्स के लिए उपलब्ध होंगी
5 टिप्पणियां
यह सच में महसूस होता है कि इसकी स्पीड बहुत तेज़ हो गई है।
अगर आप कोरियन में सवाल पूछते हैं,
मॉडल की अपनी परफ़ॉर्मेंस 2 गुना * 1.7 (कोरियन टोकन में सुधार) = 3.4 गुना तेज़ हो गई है
4O में O का मतलब Omni है।
ChatGPT का नवीनतम अपडेट: GPT-4o मॉडल और बेहतर यूज़र एक्सेसिबिलिटी
ChatGPT का फोकस इस बात पर है कि हर कोई उन्नत AI टूल्स का मुफ़्त उपयोग कर सके। डेस्कटॉप वर्ज़न और नए flagship मॉडल GPT-4o की रिलीज़ का उद्देश्य यूज़र के लिए अधिक स्वाभाविक अनुभव और बेहतर उपयोग-सुविधा प्रदान करना है। GPT-4o टेक्स्ट, विज़ुअल और ऑडियो में और तेज़ तथा उन्नत क्षमताएँ देता है, जो इंसान और मशीन के सहयोग में एक महत्वपूर्ण प्रगति साबित होगा।
GPT-4o के साथ ChatGPT का विस्तार
अब हम सभी यूज़र्स के लिए GPT-4o उपलब्ध करा रहे हैं, जो वॉइस, टेक्स्ट और विज़ुअल reasoning क्षमताएँ प्रदान करता है। नई सुविधाओं में real-time conversational voice, memory, real-time information retrieval, और advanced data analysis शामिल हैं। GPT-4o 50 भाषाओं में उपलब्ध है, और इसकी गुणवत्ता तथा गति में सुधार किया गया है, जबकि paid users के लिए usage limits और अधिक होंगी।
ChatGPT की नई real-time और responsive क्षमताएँ
ChatGPT की नई सुविधाएँ real-time responsiveness और यूज़र की भावनाओं को समझने की क्षमता प्रदान करती हैं। यह मॉडल dramatic voice, robot voice, और singing voice जैसी विभिन्न voice styles जनरेट कर सकता है। इसके अलावा, ChatGPT अब विज़ुअल tasks को भी सपोर्ट करता है और live demo environment में यूज़र्स के साथ इंटरैक्ट कर सकता है।
रैखिक समीकरण हल करना: चरण-दर-चरण
Barrett Zoph और ChatGPT, 3X + 1 = 4 समीकरण को हल करते हुए, पहले X वाले पद को अलग करते हैं, फिर X का मान निकालते हैं, और उसके बाद लागत, यात्रा योजना, तथा बिज़नेस कैलकुलेशन जैसे रोज़मर्रा के जीवन में रैखिक समीकरणों के वास्तविक उपयोग पर चर्चा करते हैं। इससे गणित को समझने और उसे वास्तविक समस्याओं में इस्तेमाल करने के लिए नया आत्मविश्वास मिलता है।
ChatGPT के साथ मौसम डेटा का विश्लेषण
ChatGPT, कोड फ़ंक्शन समझाकर और plot output की व्याख्या करके मौसम डेटा का विश्लेषण करने में मदद करता है। 'Fu' फ़ंक्शन तापमान डेटा को smooth करने और plot में noise कम करने के लिए आवश्यक है। यह plot 2018 भर के smooth average, न्यूनतम, और अधिकतम तापमान दिखाता है, साथ ही सितंबर के अंत में हुई एक बड़ी वर्षा घटना पर एक उल्लेखनीय annotation भी प्रदर्शित करता है।
बहुभाषी इंटरैक्शन और AI तकनीक
AI तकनीक live demo के ज़रिए बहुभाषी इंटरैक्शन और भावनात्मक व्याख्या की क्षमताओं का प्रदर्शन करती है। यह डेमो इस लक्ष्य पर ज़ोर देता है कि निकट भविष्य में यूज़र्स के लिए इस तकनीक तक पहुँचना और आसान बनाया जाए। साथ ही, इस प्रस्तुति में तकनीकी प्रगति में योगदान देने वाली टीम और उनके योगदान को भी मान्यता दी जाती है।
Corely, YouTube के मुख्य बिंदु सिर्फ़ 10 सेकंड में! - https://corely.ai/content/openai-spring-update-2022
Introducing GPT-4o
परिचय वीडियो का रियल-टाइम बातचीत वाला डेमो काफ़ी चौंकाने वाला है। लगभग 9 मिनट 45 सेकंड से (ऊपर दिया गया लिंक वहीं से सेट किया गया है)।
अब जवाब के बीच में आसानी से interrupt किया जा सकता है, यह लगभग real-time में जवाब देता है, और इसकी intonation भी काफ़ी बेहतर हो गई है.