- अगली पीढ़ी की Claude 3 model family की घोषणा: Haiku, Sonnet, Opus — तीन मॉडल
- इसी क्रम में ये लगातार अधिक शक्तिशाली प्रदर्शन देते हैं, जिससे उपयोगकर्ता किसी खास application के लिए intelligence, speed और cost का उपयुक्त संतुलन चुन सकते हैं
- Opus सबसे अधिक बुद्धिमान मॉडल है, जो AI systems के अधिकांश evaluation benchmarks में अन्य मॉडलों से आगे है
- MMLU में 86.8% के साथ यह GPT-4 (86.4%) और Gemini 1.0 Ultra (83.7%) से बेहतर है
- HumanEval (Code) 0-Shot में 84.9% के साथ यह GPT-4 (67%) और Gemini 1.0 Ultra (74.4%) से आगे है
- सभी Claude 3 मॉडल में analysis, prediction, content generation, code generation और non-English languages में conversation की क्षमता बेहतर हुई है
लगभग तुरंत परिणाम
- Claude 3 मॉडल live customer chat, autocomplete और data extraction जैसे उन कार्यों में इस्तेमाल किए जा सकते हैं जहाँ real-time में तुरंत प्रतिक्रिया चाहिए
- Haiku बाज़ार का सबसे तेज़ और cost-efficient मॉडल है, जो जानकारी और data से भरपूर research papers को 3 सेकंड से कम समय में पढ़ सकता है
- Sonnet, Claude 2 और 2.1 की तुलना में 2 गुना तेज़ है और उच्च intelligence देता है, जबकि Opus, Claude 2 और 2.1 जैसी ही speed पर कहीं अधिक intelligence प्रदान करता है
शक्तिशाली vision क्षमता
- Claude 3 मॉडल में उन्नत vision क्षमता है, जो photo, chart, graph, technical diagram जैसे विभिन्न visual formats को प्रोसेस कर सकती है
कम अस्वीकृति
- पिछले Claude मॉडल अक्सर अनावश्यक रूप से अनुरोध अस्वीकार कर देते थे, लेकिन Claude 3 मॉडल में system guardrails के करीब वाले prompts पर अस्वीकृति काफ़ी कम हुई है
सटीकता में सुधार
- व्यवसाय customer service के लिए मॉडल पर निर्भर करते हैं, इसलिए यह महत्वपूर्ण है कि model output सटीक बना रहे
- Opus की सटीकता पिछले मॉडल Claude 2.1 की तुलना में दोगुनी हुई है, और गलत जवाबों का स्तर भी घटा है
लंबा context और लगभग पूर्ण memory
- Claude 3 model family शुरुआत में 200K context window देगी और 10 लाख tokens से अधिक input को संभाल सकती है
ज़िम्मेदार डिज़ाइन
- Claude 3 model family इतनी सक्षम है कि उस पर भरोसा किया जा सकता है
- विभिन्न जोखिमों को ट्रैक और कम करने के लिए समर्पित टीमें हैं, और safety तथा transparency को बेहतर बनाने के तरीके लगातार विकसित किए जा रहे हैं
उपयोग में आसान
- Claude 3 मॉडल जटिल multi-step instructions को बेहतर तरीके से follow करते हैं, और brand voice तथा response guidelines का पालन करने में खास तौर पर कुशल हैं
मॉडल विवरण
- Claude 3 Opus सबसे बुद्धिमान मॉडल है, जो बेहद जटिल कार्यों में बाज़ार का सर्वश्रेष्ठ प्रदर्शन देता है
- Claude 3 Sonnet intelligence और speed के बीच आदर्श संतुलन देता है, और खासकर enterprise workloads के लिए उपयुक्त है
- Claude 3 Haiku लगभग तुरंत responsiveness के लिए सबसे तेज़ और compact मॉडल है
मॉडल उपलब्धता
- Opus और Sonnet अभी API के माध्यम से उपलब्ध हैं, जबकि Haiku जल्द उपलब्ध होगा
और स्मार्ट, और तेज़, और अधिक सुरक्षित
- उनका मानना नहीं है कि model intelligence अपनी सीमा पर पहुँच चुकी है, और Claude 3 model family के लिए लगातार updates की योजना है
- AI capabilities की सीमाओं को आगे बढ़ाते हुए वे यह सुनिश्चित करने की कोशिश कर रहे हैं कि safety guardrails भी performance improvements की ही गति से विकसित हों
1 टिप्पणियां
Hacker News राय
जटिल सवालों के लिए Opus, Gemini Pro और GPT4 पर भारी पड़ता है
आसान coding कार्यों में Claude 3 Sonnet, ChatGPT Classic से बेहतर प्रतिक्रिया देता है
Claude Pro के Opus मॉडल को आज़माकर उस पर जटिल query डाली गई
Claude 3 ने 'openai anthropic से बेहतर है' वाला script लिखने से इनकार किया
Opus के वास्तविक प्रदर्शन पर सवाल उठे