- AI तकनीक के और अधिक विकसित होने के साथ अब अधिक जटिल और महत्वपूर्ण समस्याओं को हल करना संभव हो गया है, और इसे संभव बनाने के लिए काफ़ी अधिक computing resources की आवश्यकता होती है
- ChatGPT Pro एक $200 प्रति माह प्लान है, जिसके जरिए OpenAI के नवीनतम models और tools का विस्तृत उपयोग किया जा सकता है
- o1: सबसे स्मार्ट model
- o1-mini, GPT-4o, Advanced Voice भी शामिल
- o1 pro mode: अधिक computing resources का उपयोग करके और गहराई से सोचता है तथा जटिल समस्याओं पर अधिक परिष्कृत उत्तर देता है
- आगे चलकर और अधिक शक्तिशाली productivity features जोड़े जाने की योजना है
- इसे researchers, engineers और research-केंद्रित काम करने वाले लोगों के लिए डिज़ाइन किया गया है, ताकि उनकी productivity बढ़े और वे AI प्रगति की अग्रिम पंक्ति में बने रह सकें
- ChatGPT Pro का o1 pro mode एक advanced model है जो उच्च विश्वसनीयता वाले उत्तर देता है
- खासकर data science, programming और legal analysis के क्षेत्रों में सटीक और व्यापक उत्तर देता है
- o1 और o1-preview की तुलना में math, science और coding के कठिन machine learning benchmarks पर बेहतर प्रदर्शन दिखाता है
प्रमुख प्रदर्शन तुलना (pass@1 सटीकता के आधार पर)
- गणित प्रतियोगिता (AIME 2024)
- o1-preview: 50
- o1: 78
- o1 pro mode: 86
- कोड प्रतियोगिता (Codeforces)
- o1-preview: 62
- o1: 89
- o1 pro mode: 90
- PhD-स्तर के विज्ञान प्रश्न (GPQA Diamond)
- o1-preview: 74
- o1: 76
- o1 pro mode: 79
विश्वसनीयता में सुधार: "4/4 reliability" मूल्यांकन
- एक अधिक कठोर मूल्यांकन मानक लागू किया गया: 4 प्रयासों में 4 बार सही उत्तर देने पर ही उसे समाधान माना गया
प्रमुख प्रदर्शन तुलना (4/4 विश्वसनीयता के आधार पर)
- गणित प्रतियोगिता (AIME 2024)
- o1-preview: 37
- o1: 67
- o1 pro mode: 80
- कोड प्रतियोगिता (Codeforces)
- o1-preview: 26
- o1: 64
- o1 pro mode: 75
- PhD-स्तर के विज्ञान प्रश्न (GPQA Diamond)
- o1-preview: 58
- o1: 67
- o1 pro mode: 74
7 टिप्पणियां
मैंने Pro इस्तेमाल करके देखा, लेकिन context window का छोटा होना एक गंभीर कमी है। यह लंबा कंटेंट तो लिख देता है, लेकिन कुछ समय बाद धीरे-धीरे पहले जो लिख रहा था उसका कंटेंट या फ़ॉर्मैट टूटने लगता है।
ऐसा लग रहा है कि OpenAI धीरे-धीरे
openसे और दूर होता जा रहा है.शायद यही हकीकत है.
लागत वहन करना मुश्किल होने की वजह से लगा था कि शायद Plus की subscription fee बढ़ेगी, लेकिन ऐसा नहीं है; वे एक और महंगी lineup शुरू करके बाज़ार को target कर रहे हैं। मैं इसे आम तौर पर वाकई बहुत अच्छे से इस्तेमाल कर रहा हूँ, लेकिन मुझे नहीं लगता कि मुझे Pro version तक की ज़रूरत होगी। हाहा
मैं अभी Plus इस्तेमाल कर रहा हूँ। कुछ समय पहले से महसूस हो रहा है कि उसी तरह के इंजन पर उसी तरह के प्रॉम्प्ट चलाने पर भी आउटपुट बदल गया है। लगता है कि पहले जितना अच्छा प्रदर्शन नहीं मिल रहा।
ऐसा भी लगता है कि शायद मौजूदा Plus में इस्तेमाल किए जा सकने वाले मॉडलों को nerf करके अलग से बेच रहे हैं।
आमतौर पर लागत जितनी बढ़ती है, प्रदर्शन पर भरोसा भी होता है, लेकिन AI services में वैसा नहीं है। जैसे किसी दिन अचानक चुपचाप इंटरनेट लाइन पर limit लगा दी जाए, वैसे ही लगता है AI भी उस दिशा में जा सकता है.
मैं भी Plus इस्तेमाल कर रहा हूँ, लेकिन क्या इसे जवाबों का टोन कहें? नाम तो वही o1 है, मगर कुल मिलाकर इसकी फील preview से बिल्कुल अलग हो गई है। यहाँ तक लगता है जैसे कोई token output को दबा रहा हो।
सहमत हूँ। मैं भी महसूस कर रहा हूँ कि एक ही अस्थायी version इस्तेमाल करने पर भी बिना किसी अलग उल्लेख के performance ऊपर-नीचे होती रहती है। थोड़ा अलग मुद्दा है, लेकिन किसी खास service के बारे में यह कि वह जानकारी इकट्ठा नहीं करती, इसे जांचने का भी कोई तरीका नहीं है, इसलिए लगता है कि यह आखिरकार सिर्फ भरोसे का मामला बन जाता है।
Hacker News की राय
OpenAI open source विकल्पों की तेज़ प्रगति और revenue generation की ज़रूरत के बीच प्रतिस्पर्धा कर रहा है। इसकी सफलता इस बात पर निर्भर करती है कि क्या बड़ी कंपनियाँ OpenAI के integrated और सुरक्षित AI solutions को चुनती हैं। यह IBM की enterprise computing strategy जैसा है.
Pro version का context window छोटा होना निराशाजनक है। Plus member के रूप में मैंने लंबा context window अपेक्षित किया था, लेकिन इस पर कोई चर्चा ही नहीं है। मैं ज़ोरदार सिफारिश करता हूँ कि प्रतिस्पर्धी context window को एक differentiator के रूप में देखें.
Pro subscription खरीदने के बाद पहला impression यह है कि नया o1-Pro model बहुत शानदार writer है। यह लंबे prompts और complex data analysis को अच्छी तरह संभालता है.
ज़्यादा computing power के लिए यह plan pricing tactic में decoy effect से समझाया जा सकता है। एक महंगा option लाकर दूसरे plans को अधिक उचित दिखाया जाता है.
मैं Claude Teams के लिए हर महीने 166 euro देता हूँ। इसकी वजह project features के साथ जुड़ी वह क्षमता है जिसमें बहुत सारी files upload करके खास context में सवाल पूछे जा सकते हैं। यह feature ऐसा शक्तिशाली है मानो researchers आपकी उंगलियों पर हों.
Anthropic से मुझे बहुत कम लागत में बेहतर performance मिलती है। इस दावे पर संदेह है कि नया GPT, Claude से 10 गुना बेहतर है.
संदेह है कि OpenAI निवेशकों के थकने से पहले "general" AI हासिल कर पाएगा या नहीं। ChatGPT की सफलता के जरिए उन्होंने शायद संकेत दिया हो कि उनके पास इसे हासिल करने का रास्ता है.
उत्पाद के "unlimited" उपयोग के लिए monthly subscription pricing में सबसे बड़ी कठिनाई वे 1% power users हैं जो अत्यधिक उपयोग करते हैं। ChatGPT Pro की pricing power users/enterprises को ध्यान में रखकर की गई लगती है.
जटिल Google Sheets formulas लिखने में 4.5 घंटे खर्च किए। अगर नया ChatGPT Pro mode यह काम तेज़ कर दे, तो time savings के लिहाज़ से यह बड़ा फायदा है.
interview mill में o1 model का इस्तेमाल करके interviews लेने के मामले हैं। ऐसे use cases में $200 का monthly fee सस्ता महसूस हो सकता है.