-
OpenAI के अनुसार, GPT-4 और GPT-3.5 के बीच रोज़मर्रा की बातचीत में अंतर सूक्ष्म हो सकता है। लेकिन जैसे-जैसे काम अधिक जटिल होता है, GPT-4 अधिक स्थिर, अधिक रचनात्मक और सूक्ष्म निर्देशों को संभालने में अधिक सक्षम है.
-
इसके अलावा, GPT-4 इमेज इनपुट से टेक्स्ट आउटपुट भी सपोर्ट करता है। OpenAI द्वारा दिया गया उदाहरण यह था कि एक इमेज देकर पूछा जाए कि उसमें 'क्या मज़ेदार है'। OpenAI ने उस meme के हास्य का विश्लेषण करके बताया। (यह सुविधा अभी research preview है और सार्वजनिक उपयोग के लिए अभी उपलब्ध नहीं है.)
-
इस GPT-4 मॉडल में, GPT-3.5 के समय AI को किसी विशेष भूमिका में मानकर लिखे जाने वाले prompt को
systemनाम के अलग सेक्शन में रखा जा सकता है, जिससे AI की शैली और काम को अधिक सीधे तौर पर परिभाषित किया जा सकता है। (OpenAI भी जानता है कि इस हिस्से का तथाकथित 'jailbreak' यानी content restrictions को bypass करने के लिए दुरुपयोग किया जा सकता है.) -
GPT-4 अब भी hallucination समस्या से जूझता है। (यानी जो वास्तव में मौजूद नहीं है, उसे मौजूद मान लेना और reasoning errors करना.) लेकिन पिछले मॉडल की तुलना में इसे internal evaluations में 40 प्रतिशत अधिक अंक मिले हैं.
-
GPT-4 में अब भी disallowed content जनरेट करने का जोखिम है, लेकिन GPT-3.5 की तुलना में policy-violating content जनरेट करने की दर 82 प्रतिशत कम हुई है, और sensitive requests (medical advice, self-harm) पर policy के अनुसार जवाब देने की आवृत्ति 29 प्रतिशत अधिक है.
-
फिलहाल GPT-4 मॉडल केवल ChatGPT Plus subscribers के लिए उपलब्ध है, और 4 घंटे में 100 messages की सीमा के साथ दिया जा रहा है। OpenAI ने कहा है कि इस सीमा से जुड़ी अतिरिक्त paid policy पर काम किया जा रहा है, और लंबी अवधि में इसे free users के लिए भी उपलब्ध कराने की योजना है.
ऊपर के इस सारांश में GPT-4 को कैसे train किया गया, OpenAI Evals की व्याख्या, विस्तृत उदाहरण और सीधे benchmarks शामिल नहीं हैं। अन्य महत्वपूर्ण तथ्य भी छूटे हो सकते हैं, इसलिए कृपया मूल लेख देखें.
10 टिप्पणियां
3.5 की तरह अनुमान लगाकर(?) जवाब देने की प्रवृत्ति काफ़ी कम हो गई है, और अगर नहीं पता हो तो ईमानदारी से कह देता है कि उसे नहीं पता।
लगता है कि रिटायरमेंट तक यह मौजूदा काम करते हुए रोज़ी-रोटी चलाना मुश्किल होगा।
लगता है Skynet अब ज़्यादा दूर नहीं है..
GPT-4 की ताकत
https://www.clien.net/service/board/park/17962934
काफी तरह-तरह के memes हैं।
कॉमेंट्स में एक तुलना है कि गर्लफ्रेंड के नाराज़ होने पर उसे मनाने के तरीके के बारे में 3.5 और 4 ने क्या जवाब दिया, और फ़र्क काफ़ी बड़ा है। हा
TensorFlow Korea ग्रुप में पोस्ट की गई Lee Sang-hoon की GPT-4 Technical Report समीक्षा
https://www.facebook.com/groups/TensorFlowKR/posts/1992265094447872
जैसे ही यह आया, मैंने GPT-4 और GPT-3.5 से ऐसा सवाल पूछा।
GPT-3.5 का जवाब और GPT-4 का जवाब साफ़ तौर पर अलग थे। GPT-4 प्रक्रिया के अनुसार हर फ़ाइल की भूमिका अलग-अलग बताता है, और Godot editor में वास्तव में उसे फ़ॉलो करने पर उसी परिणाम तक पहुँचा जा सके, ऐसे सही निर्देश देता है; लेकिन GPT-3.5 ने बस ऊपर-ऊपर से काम करता हुआ लगने वाला टूटा-फूटा कोड उगल दिया।
अब शायद एकल-डेवलपर गेम बड़ी संख्या में आने लगें...लगता है कि गेम development के लिए इससे बेहतर समय पहले कभी नहीं था।
बेशक, mass-produced novels की तरह mass-produced games को लेकर चिंता भी है...लेकिन आखिरकार उम्मीद है कि AAA गेम कंपनियां भी अपने work environment में बड़ा बदलाव लाकर ज्यादा efficient और high-quality games बिना bugs के...अच्छी तरह जारी करें।
लगता है लुडाइट बन जाने का मन कर रहा है... T_T
अब आगे सैलरी लेकर जी पाऊँगा भी या नहीं..
रोम का नागरिक बनने की दुआ करनी पड़ेगी lol
मैंने सोचा था कि Godot Engine होने का कारण यह है कि Unity की तुलना में इसके बारे में सामग्री कम है, इसलिए इसे टेस्ट करने के लिए यह उल्टा ज़्यादा उपयुक्त होगा। आम तौर पर जब सामग्री इतनी ज़्यादा नहीं होती, तब यह किस हद तक जवाब दे पाता है, यह जानने की जिज्ञासा थी। लेकिन इसने इतना अच्छा किया कि मैं हैरान रह गया....