- GPT-4.1, GPT-4.1 mini, GPT-4.1 nano — तीन मॉडल पेश किए गए
- GPT-4o की तुलना में कुल मिलाकर बेहतर प्रदर्शन, खासकर coding, instruction following, और long-context understanding में उल्लेखनीय सुधार
- तीनों मॉडल अधिकतम 1 million tokens का context window सपोर्ट करते हैं, इसलिए बड़े codebase और जटिल दस्तावेज़ विश्लेषण के लिए उपयुक्त हैं
- कम latency और कम लागत के साथ शानदार प्रदर्शन
- प्रमुख प्रदर्शन सुधार
- coding क्षमता: SWE-bench Verified में 54.6%, जो GPT-4o की तुलना में +21.4%p सुधार है
- instruction following: MultiChallenge स्कोर 38.3%, जो GPT-4o से +10.5%p बेहतर है
- multimodal long-context understanding: Video-MME(long, no subtitles) में 72.0%, GPT-4o की तुलना में +6.7%p
- GPT-4.1 मॉडल परिवार की विशेषताएँ
- GPT-4.1 mini: intelligence evaluation में GPT-4o से बेहतर, latency आधी, लागत 83% कम
- GPT-4.1 nano: सबसे कम लागत और सबसे कम latency, फिर भी उच्च प्रदर्शन बनाए रखता है
- GPT-4.5 Preview 14 जुलाई 2025 को बंद किया जाएगा, GPT-4.1 series पर जाने की सिफारिश
- vision (image understanding और multimodal)
- GPT-4.1 mini image-based benchmark में GPT-4o से आगे
- MMMU, MathVista, CharXiv आदि में उच्च सटीकता
- Video-MME (30~60 मिनट के बिना subtitle वाले वीडियो पर प्रश्न): 72.0% accuracy
- pricing policy
- सभी मॉडल जारी किए गए हैं और उपयोग के लिए उपलब्ध हैं
- GPT-4.1 GPT-4o से औसतन 26% सस्ता है
- GPT-4.1 nano सबसे कम लागत वाला मॉडल है
- cached input पर 75% छूट, और long context पर कोई अतिरिक्त लागत नहीं
- मॉडल-वार कीमत
- GPT-4.1: input प्रति 1 million tokens $2.00, output $8.00, औसत लागत लगभग $1.84
- GPT-4.1 mini: input $0.40, output $1.60, औसत $0.42
- GPT-4.1 nano: input $0.10, output $0.40, औसत $0.12
- prompt cache discount को पहले के 50% से बढ़ाकर 75% तक किया गया
- long-context requests पर कोई अतिरिक्त शुल्क नहीं, केवल token usage के आधार पर शुल्क
1 टिप्पणियां
Hacker News राय
ChatGPT उपयोगकर्ताओं ने अलग-अलग models चुनने की स्थिति को लेकर भ्रम व्यक्त किया
SWE-bench Verified, Aider Polyglot, लागत, प्रति सेकंड output tokens, knowledge cutoff month/year की तुलना
OAI ने GPT 4.1 के लिए prompt guide जारी की
OpenAI की घोषणा के अनुसार, Claude Sonnet 3.7 के साथ code review generation मुकाबले में GPT-4.1 ने 55% मामलों में बेहतर सुझाव दिए
हाल की Ted Talk में Sam ने कहा कि models आते-जाते रहेंगे, लेकिन वे सबसे अच्छा platform बनना चाहते हैं
जटिल code base में GPT-4.1 का उपयोग करने का अनुभव साझा किया गया
लंबे max token models के performance पर benchmark की आवश्यकता उठाई गई
बड़े AI research labs एक साथ कई market wars लड़ रहे हैं
GPT-4.1 ने 164 comments वाले Hacker News thread का सारांश बनाया