2 पॉइंट द्वारा GN⁺ 2023-11-22 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Claude 2.1 API के ज़रिए उपलब्ध है और claude.ai चैट अनुभव प्रदान करता है.
  • 200K token context window, model hallucination में कमी, system prompt, और नए beta फीचर tool use इसकी मुख्य विशेषताएँ हैं
  • ग्राहकों की cost efficiency बेहतर करने के लिए pricing policy को अपडेट किया जाएगा

200K context window

  • Claude उपयोगकर्ता बड़े context window और लंबे दस्तावेज़ों पर काम करते समय अधिक सटीक output की मांग कर रहे थे
  • 200,000 tokens के साथ, लगभग 150,000 शब्द या 500 पेज से अधिक सामग्री Claude को दी जा सकती है
  • Claude बड़े पैमाने की content या data के साथ संवाद करते हुए summary, Q&A, trend prediction, और multi-document comparison जैसे विविध काम कर सकता है

hallucination दर में 2 गुना कमी

  • Claude 2.1 ईमानदारी बढ़ाने के लिए false statements की दर को 2 गुना कम करता है
  • कंपनियाँ अधिक भरोसे और reliability के साथ AI applications बना सकती हैं और उन्हें production में deploy कर सकती हैं
  • Claude 2.1 understanding और summarization क्षमता में सुधार दिखाता है, खासकर लंबे और जटिल दस्तावेज़ों में जहाँ accuracy की ज़रूरत होती है

API Tool Use

  • यह एक नया beta फीचर "Tool Use" जोड़ता है, जो उपयोगकर्ताओं के मौजूदा process, product, और API के साथ integration कर सकता है
  • Claude डेवलपर द्वारा परिभाषित functions या API को orchestrate कर सकता है, web sources खोज सकता है, और private knowledge base से जानकारी ला सकता है
  • Tool Use अभी शुरुआती development stage में है, और developer features व prompt guidelines तैयार किए जा रहे हैं

डेवलपर अनुभव

  • Claude API उपयोगकर्ताओं के लिए developer console experience को सरल बनाया गया है और नए prompt tests को आसान किया गया है
  • नए Workbench product के माध्यम से डेवलपर prompts पर iterate कर सकते हैं और Claude के व्यवहार को optimize करने के लिए model settings तक पहुँच सकते हैं
  • system prompt पेश किया गया है ताकि उपयोगकर्ता Claude को custom instructions दे सकें

GN⁺ की राय

  • Claude 2.1 की सबसे महत्वपूर्ण विशेषताएँ 200K token context window और hallucination दर में कमी हैं, जिससे उपयोगकर्ता बड़े दस्तावेज़ों और data को संभालकर अधिक भरोसेमंद नतीजे पा सकते हैं
  • ये क्षमताएँ AI तकनीक की प्रगति को दिखाती हैं और कंपनियों व डेवलपर्स को अधिक efficient और accurate tools देकर उनके काम में बदलाव लाने की क्षमता रखती हैं
  • यह लेख AI तकनीक के ताज़ा रुझानों और डेवलपर्स के लिए उपलब्ध नए tools के बारे में रोचक जानकारी देता है, इसलिए यह तकनीक में रुचि रखने वालों के लिए आकर्षक सामग्री है

1 टिप्पणियां

 
GN⁺ 2023-11-22
Hacker News राय
  • 200k context का मिला-जुला असर: 70k से 195k पर error rate का तेज़ी से बढ़ना निराशाजनक है। लेकिन बीच के हिस्से में errors कम होने के लिए तारीफ़ बनती है।
  • मॉडल के सीमित उपयोग पर असंतोष: Claude उतना कम मना नहीं करता जितना शीर्षक से दावा किया गया है। Anthropic मॉडल को ज़रूरत से ज़्यादा censor कर रहा है, जिससे इसका इस्तेमाल मुश्किल हो जाता है। टूल का फ़ैसला user को करना चाहिए, टूल को user का नहीं।
  • शीर्षक और सामग्री के बीच असंगति: घोषणा में कहा गया 'refusal में कमी' वास्तविक सामग्री से मेल नहीं खाता। इससे संकेत मिलता है कि Claude 2.1 गलत जानकारी देने की बजाय मना करने की अधिक संभावना रखता है।
  • coding में अक्षमता: GPT-4 की तुलना में 10 गुना खराब। जब एक साधारण database sync function माँगा गया, तो असली code की जगह बहुत सा pseudocode दिया गया।
  • मॉडल के प्रति नकारात्मक धारणा: Anthropic के मॉडल को ज़्यादातर requests ठुकराने के लिए हद से ज़्यादा train किया गया लगता है, इसलिए Claude के साथ बातचीत सुखद नहीं लगती।
  • विचारधारात्मक नज़रिए से refusal का उदाहरण: effective altruist की तरह बोलने के लिए vocabulary list माँगने पर मना कर देने से एक हास्यास्पद स्थिति बन गई।
  • Claude 2 से निराशा: शुरुआत में उम्मीद थी, लेकिन GPT-4 की तुलना में इसका प्रदर्शन काफ़ी कमज़ोर लगा; बड़ा context window भी बेकार है अगर जवाबों की quality खराब हो।
  • API उपयोग की accessibility समस्या: API इस्तेमाल करने में रुचि है, लेकिन कोई जवाब नहीं मिला, जिससे निराशा हुई। developer platform के रूप में रुचि की कमी दिखती है।
  • API access की कठिनाई: Anthropic की website या Bedrock के ज़रिए किए गए अनुरोधों का जवाब नहीं मिला, इसलिए business के लिए API access अव्यावहारिक लगता है।
  • system prompt की शुरुआत में रुचि: इस बात पर ध्यान गया कि user अब Claude को customized instructions देकर performance बेहतर कर सकते हैं। इसके उपयोग और दुरुपयोग दोनों की आसानी को लेकर उत्सुकता है।
  • Claude के test उपयोग और OpenAI का चयन: अभी production में इस्तेमाल नहीं हो रहा, लेकिन LLM के साथ नई features बनाते समय इसे नियमित रूप से testing में शामिल किया जाता है। OpenAI ने तेज़ी से approval लेकर market में पहले जगह बनाई, और उसकी API बेहतर, ज़्यादा reliable और सस्ती है। लेकिन Claude के AWS Bedrock में शामिल होने से अब वे चीज़ें संभव हुई हैं जो पहले नहीं थीं।