- 128K context window को सपोर्ट करने वाला GPT-4 Turbo मॉडल, Vision के साथ GPT-4 API, Assistants API, DALL-E 3 API, नया GPT-3.5 Turbo आदि पेश किए गए।
- GPT-4 Turbo
- यह 128K context window को सपोर्ट करता है और 2023 के अप्रैल तक के डेटा पर प्रशिक्षित है।
- GPT-4 की तुलना में input tokens 3 गुना और output tokens 2 गुना सस्ते हैं।
- यह खास format में जवाब देने वाले निर्देशों का बेहतर पालन करता है, और इसमें JSON mode भी है जो JSON response की गारंटी देता है।
- यह seed-आधारित reproducible output को सपोर्ट करता है और output के लिए log probabilities लौटाने की सुविधा भी जोड़ी जाएगी।
- GPT-3.5 Turbo को भी साथ में अपडेट किया गया है।
- Assistants API
- code interpreter, search, और function calling फीचर्स वाला special-purpose AI।
- thread-आधारित state management के जरिए यह अनंत लंबाई की सामग्री भी संभाल सकता है।
- code interpreter - sandbox environment में Python code लिख और चला सकता है।
- search - मॉडल के बाहर के knowledge, जैसे user द्वारा दिए गए documents, में खोज कर जवाब देता है।
- function calling - user द्वारा define किए गए functions को उचित तरीके से call कर सकता है और response में उनके results शामिल कर सकता है।
- अन्य नए API
- GPT-4 Turbo में image recognition क्षमता जोड़ी गई है।
- DALL-E 3 को API के रूप में जारी किया गया है, और प्रति image generation कीमत 0.04 डॉलर है।
- TTS API जोड़ा गया है।
- मॉडल customization
- GPT-4 fine-tuning मॉडल experimental access के रूप में जारी किया जाएगा।
- बड़े संगठनों के लिए custom models बनाने हेतु tailored model service प्रदान की जाएगी।
- जैसे अरबों tokens से अधिक के proprietary datasets पर training।
- कीमत में कटौती
- GPT-4 Turbo 128K की कीमत input token के लिए 0.01 डॉलर और output token के लिए 0.03 डॉलर है।
- पहले की तुलना में input tokens 3 गुना और output tokens 2 गुना सस्ते हो गए हैं।
- GPT-3.5 Turbo 16K input token के लिए 0.001 डॉलर और output token के लिए 0.002 डॉलर में उपलब्ध है।
- पहले की तुलना में input tokens 3 गुना और output tokens 2 गुना सस्ते हुए हैं, और 4K model की तुलना में input tokens 33% सस्ते हैं।
- GPT-3.5 Turbo के fine-tuning models input token के लिए 0.003 डॉलर और output token के लिए 0.006 डॉलर में उपलब्ध हैं।
- पहले की तुलना में input tokens 4 गुना और output tokens 2.7 गुना सस्ते हो गए हैं।
8 टिप्पणियां
मैंने कल से GN⁺ में भी GPT-4 Turbo लागू किया है.
वाकई जवाब तेज़ हो गए हैं, और यह निर्देशों को पहले से बेहतर समझता है.
जैसा कहा जाता है, वैसा ही अच्छी तरह सारांश बनाता है और आउटपुट भी साफ़-सुथरा देता है.
पहले मैं अंग्रेज़ी prompts मिलाकर इस्तेमाल करता था, लेकिन अब सिर्फ़ कोरियाई prompts से भी बेहतरीन जवाब मिल रहे हैं.
मुझे AI की बहुत ज़्यादा समझ नहीं है, लेकिन कीमतों में गिरावट की रफ़्तार शायद और तेज़ होती जाएगी, है ना? सच में 1-2 साल बाद की दुनिया कैसी होगी, इसका अंदाज़ा ही नहीं लग रहा।
ऊपर दी गई प्रति-टोकन कीमत 1000 टोकन के आधार पर है। कृपया ध्यान दें।
वाह, और 128K टोकन भी... अब जिन उपयोगों के लिए मैं इसे इस्तेमाल करता हूँ, उनमें आम तौर पर context की समस्या खत्म हो जाएगी।
अरे, मैं भी यही पोस्ट करने के लिए इसे整理 कर रहा था, लेकिन देर हो गई T_T
जब Anthropic ने 100K मॉडल जारी किया था तब भी हैरानी हुई थी, लेकिन अब GPT-4 ने 128K टोकन जारी करके फिर से आगे निकलता हुआ लग रहा है।
कीमत भी कुल मिलाकर कई गुना घटा दी है, तो OpenAI की तकनीकी क्षमता आखिर कहाँ तक है...
खैर, इसका तो दिल से स्वागत है।
GPT-4 वैसे भी चुपचाप काफ़ी महंगा था (खासकर 16K इस्तेमाल करने पर), लेकिन अब टोकन साइज़ भी काफ़ी बढ़ा दिया है और सच में कीमत भी बहुत कम हो गई है। +_+
और Assistants API को लेकर भी जिज्ञासा है, एक बार इस्तेमाल करके देखना पड़ेगा।
कहा जा रहा है कि खोज के लिए embedding का इस्तेमाल न भी करना पड़े, तो शायद यह और भी फ़ायदेमंद लगे...?
HN थ्रेड का AI सारांश।
इसमें hallucination है।
कीमतें सब लिखी गई हैं।