1 पॉइंट द्वारा GN⁺ 4 시간 전 | 4 टिप्पणियां | WhatsApp पर शेयर करें
  • Anthropic ने अमेरिकी सरकार के साथ बातचीत के बाद Fable 5 साइबरसिक्योरिटी सुरक्षा उपायों को अपडेट किया है, और अधिकांश coding काम पहले की तरह इस्तेमाल किए जा सकते हैं
  • नए सुरक्षा उपाय अल्पावधि में पहले के Fable सुरक्षा उपायों की तुलना में हानिरहित अनुरोधों को अधिक बार flag कर सकते हैं, और Anthropic आने वाले कुछ हफ्तों में इन्हें समायोजित करेगा
  • अगर कोई अनुरोध flag होता है, तो उपयोगकर्ता को सूचना दिखाई जाएगी, और उसका उत्तर Opus 4.8 के माध्यम से दिया जाएगा
  • biology·chemistry classifier शुरुआती रिलीज़ जैसा ही है, इसलिए बुनियादी biology-संबंधित प्रश्न भी Opus 4.8 fallback तक ले जा सकते हैं
  • usage शामिल करने वाले paid plan 7 जुलाई तक Fable 5 को साप्ताहिक usage limit के 50% तक इस्तेमाल कर सकते हैं, उसके बाद अन्य model या usage credits का उपयोग करना होगा

Fable 5 एक्सेस की बहाली और सुरक्षा उपायों में समायोजन

  • Anthropic ने अमेरिकी सरकार के साथ बातचीत के बाद साइबरसिक्योरिटी सुरक्षा उपायों को अपडेट किया है
  • अधिकांश coding कार्य इस बदलाव से प्रभावित नहीं होते
  • अल्पावधि में नए सुरक्षा उपाय पहले के Fable सुरक्षा उपायों की तुलना में हानिरहित अनुरोधों को थोड़ा अधिक flag कर सकते हैं
    • Anthropic आने वाले कुछ हफ्तों में classifier को बेहतर करेगा
    • flag किए गए अनुरोधों की जानकारी उपयोगकर्ता को स्पष्ट रूप से दी जाएगी
    • संबंधित उत्तर Opus 4.8 से दिया जाएगा

biology·chemistry classifier की वर्तमान सीमाएँ

  • biology और chemistry classifier शुरुआती रिलीज़ के समय जैसे थे वैसे ही हैं
    • मौजूदा classifier अपेक्षित स्तर से अधिक व्यापक रूप से काम कर रहा है
    • बुनियादी biology-संबंधित प्रश्नों पर भी Opus 4.8 fallback हो सकता है
    • इस classifier में सुधार जल्द लागू किया जाएगा

paid plan की उपयोग शर्तें और feedback के रास्ते

  • usage शामिल करने वाले सभी paid plan 7 जुलाई तक Fable 5 तक पहुँच सकते हैं
  • Fable 5 को साप्ताहिक usage limit के अधिकतम 50% तक इस्तेमाल किया जा सकता है
    • इसके बाद बची हुई usage के लिए अन्य model पर स्विच किया जा सकता है
    • usage credits के जरिए Fable का उपयोग जारी भी रखा जा सकता है
  • promotional access जानकारी: Claude Fable 5 promotional access
  • अगर Claude Code में किसी अनुरोध को गलत तरीके से flag किया गया हो, तो /feedback से रिपोर्ट किया जा सकता है
  • Claude.ai और Cowork में thumbs button के जरिए feedback साझा किया जा सकता है
    • इस feedback का उपयोग classifier को समायोजित करने और false positive कम करने में किया जाएगा
  • Fable 5 ब्लॉग पोस्ट: Claude Fable 5 Mythos 5

4 टिप्पणियां

 
seoseonyu 1 시간 전

7 जुलाई... लगता है बस 5.6 Sol का इंतज़ार ही करना पड़ेगा

 
treestae 21 분 전

मैं भी Sol का इंतज़ार कर रहा हूँ.
शायद Galaxy या Cosmos भी आएँगे...

 
GN⁺ 4 시간 전
Hacker News की राय
  • Fable/Mythos के weights, चाहे दुर्भावना से हो या नहीं, एक ही गलती से विरोधी ताकतों तक लीक हो सकते हैं या किसी भी torrent पर चढ़ सकते हैं, ऐसा लगता है
    Fable के weights सैकड़ों datacenter में deploy होंगे, और हजारों लोगों के पास सीधे या परोक्ष रूप से कुछ या पूरा access होने की संभावना है। अगर यह सचमुच दुनिया खत्म कर देने वाला मॉडल होता, तो शायद इसे ऐसे handle नहीं किया जाता; Mythos के लिए इतना मान सकता हूं कि वह केवल सरकारी compliance वाले datacenter के अंदर ही चलेगा। लेकिन अगर मॉडल इतना मूल्यवान है, तो state-sponsored hackers उसे निकालने के लिए कहीं ज्यादा बड़ा प्रयास करेंगे। वास्तविक स्थिति जो भी हो, इसे Anthropic के कहे जितना क्रांतिकारी मानना मुश्किल है

    • GPT-2 के समय से ही सुनते आ रहे हैं कि मॉडल बहुत खतरनाक है
      एक समय के बाद बात उस स्तर से भी आगे निकल जाती है कि चरवाहे लड़के से “भेड़िया आया” चिल्लाना बंद करने की उम्मीद हो; बल्कि मन करने लगता है कि उसे भेड़िया खा ही जाए
    • हो सकता है लंबे समय में सबसे अच्छा यही हो कि Mythos किसी तरह लीक हो जाए और पूरी मानवता उसे self-hosting के जरिए इस्तेमाल कर सके
    • मामला जितना दिखता है उससे ज्यादा जटिल हो सकता है। मेरी जानकारी में Nvidia अपने महंगे product line में TEE देती है, इसलिए weights के encrypted अवस्था में इस्तेमाल होने की संभावना बड़ी है
      इसका मतलब यह नहीं कि leak असंभव है, लेकिन यह काफी बड़ा काम बन जाता है। Anthropic को Elon की तरफ मॉडल serve करने को लेकर बहुत ज्यादा चिंता न होने की वजह भी यही हो सकती है। मोटे तौर पर flow ऐसा होगा: Nvidia TEE से handshake, key inject करना, फिर encrypted weights upload करना। चोरी किए गए weights से Nvidia equipment लगातार न चल पाए, इसलिए heartbeat signal न होने पर expire होने वाला timer भी होने की संभावना है
    • लगता नहीं कि Anthropic सच में इसे दुनिया खत्म करने वाला बता रहा है। बस इतना लगता है कि इसमें offensive cybersecurity capabilities हैं, इसलिए यह जोखिम भरा हो सकता है
    • मेरे हिसाब से यह सब marketing है। सरकार बार-बार insider trader जैसी दिखती रही है
  • मानव चेतना पर किताब का manuscript डाला तो block हो गया। यह मॉडल हास्यास्पद रूप से खराब है, और Anthropic ने इसे इतने स्तर तक neuter कर दिया है कि malicious लगता है
    जो चीज असल में बेकार है, उसके लिए पैसे देने का इरादा नहीं है

    • आज Sonnet से browser MCP का इस्तेमाल करके मेरे काम वाले project का username और password enter करने को कहा, तो उसने जवाब दिया कि यह security protocol violation है और वह नहीं कर सकता
      पहले यह ठीक चलता था। Claude पसंद था, इसलिए Codex बेहतर है ऐसी बातें सुनकर भी इस्तेमाल करता रहा, लेकिन यह सच में आखिरी सीमा के करीब है। महीने के 200 डॉलर से ज्यादा देना, contract work में भी उसे push करना, और फिर भी ऐसा service न मिलना जिसमें बुनियादी respect हो—यह पूरी तरह बेतुका है। 6 महीने बाद शायद सिर्फ Easy-Bake recipes पर बात करने देंगे, और अगर कोई bulb से जल जाए तो स्तर और गिराकर wildflower meadow की बातें कराएंगे
    • वही समस्या है। भाषा और thermodynamics पर लिखी जा रही किताब भी block हो गई। classifier बस regex जैसा लगता है
    • समय खास तौर पर अटपटा है। क्योंकि इस मॉडल की ताकत लंबा work horizon, persistence, और बड़े कामों को autonomously आगे बढ़ाने की क्षमता बताकर promote की गई थी
      लेकिन अगर बीच में Opus 4.8 पर लौटना पड़े या कभी भी cut off हो सकता है, तो उस क्षमता पर निर्भर करना मुश्किल है। ऐसे लंबे process चलाने पर यह काफी solid तरीके से चलता है, फिर जैसे ही कुछ failure के रूप में classify होता है, ‘long-running task’ मर जाता है और इंसान को उसे बचाना पड़ता है या जबरन rollback करके retry करना पड़ता है
    • मेरी पहली request से ही block हो गया। मेरी partner ने website frontend में दिखे bug notes, product copy edits, CSS bugs, और wording issues पढ़ने को कहा था, और यह तुरंत block हो गया। बेकार है
    • इस बार ऐसा करना जरूरी रहा होगा, ऐसा लगता है। कल classifier के लिए safety margin बढ़ाने वाली post देखिए
  • जब Fable नहीं था, तब Opus से ही काफी महसूस हुआ। अब वह लौट आया है, लेकिन उसकी बिल्कुल कमी महसूस नहीं हुई

  • आज रात इस्तेमाल तो करूंगा, लेकिन मन नहीं है। क्योंकि 7 जुलाई के बाद, अभी subscription से जितनी बड़ी value मिल रही थी, उससे अचानक API pricing देना नहीं चाहता
    शायद यही वह “token economics” है जो इस साल सब पर आने वाली है। जो भी हो, जब तक इस्तेमाल कर सकता हूं तब तक पूरा निकालूंगा, और उसके बाद भरोसेमंद partners Opus 4.6 और Sonnet 4.6 पर लौटने का सोच रहा हूं। पता नहीं वे कब तक उपलब्ध रहेंगे

    • ऐसे इस्तेमाल करोगे तो quota तुरंत खत्म हो जाएगा और आखिरकार API pricing ही देनी पड़ेगी, नहीं?
    • मुझे लगभग पूरा यकीन है कि 7 जुलाई के बाद Max 350 plan आएगा
    • performance degradation शुरू होने के आसपास मैंने default model को Opus 4.6 पर lock कर दिया। 4.7+ से results बहुत बेहतर हैं
      शायद service degradation इसी को कहते हैं
  • US-based models पर trust loss शायद recover करना मुश्किल होगा
    Anthropic के बढ़ा-चढ़ाकर दिए गए doomsday messaging और उससे प्रभावित administration के कारण trust काफी घटा, और एक तरह की arms race भी trigger हुई

    • उल्टा, “हमारा product इतना अच्छा था कि ban होने लायक था” सबसे बेहतरीन advertisement है। OpenAI ऐसी स्थिति पाने के लिए पागल हो जाती
      Sonnet 5 को तुरंत test करने का मन नहीं है, लेकिन Fable में काफी interest है
    • उम्मीद है OpenAI और चीनी कंपनियां जरूरी competition लेकर आएंगी
    • अगर आपने AI-based product बनाया है, तो providers diversify करें या abstraction layer बनाएं ताकि किसी model पर lock-in न हो। कोई भी model plug करके इस्तेमाल किया जा सकना चाहिए
      अगर आप end user software engineer हैं, तो Gemini या ChatGPT जैसे दूसरे models इस्तेमाल कर सकते हैं। जो trust शुरू से था ही नहीं, उसके बारे में complain करने से यह ज्यादा productive है। Anthropic बस service देने वाली company है, और export ban हो या न हो, वह कभी भी service बंद कर सकती है। किसी भी देश की कोई भी AI company ऐसी ही है। अगर सच में trustable LLM चाहिए, तो open weights model खुद चलाना होगा
    • उल्टा सोचिए, अगर Anthropic ने अभी जैसा communicate नहीं किया होता और Fable का इस्तेमाल Pentagon hack में हुआ होता तो क्या होता। Dario को पेड़ से लटका दिया जाता
    • ज्यादातर users को शायद पता भी नहीं होगा कि ऐसा कुछ हुआ था। हम जो यहां HN के अंदर रहते हैं, अक्सर भूल जाते हैं कि हम bubble के अंदर हैं। कंपनी इसे success के रूप में package करके आगे बढ़ती रहेगी
  • कुछ projects में पूरा code generate करवाने के बजाय, plan और test/format validation loop generate करवाना ज़्यादा उपयोगी हो सकता है
    ऐसे outputs पूरे project की तुलना में बहुत कम tokens लेते हैं, और बाद के loops पुराने models पर चलाए जा सकते हैं

    • आज 2 repositories में फैले एक project पर मैंने ऐसा करके देखा। एक मुख्य use case का design पहले से तय था, और काम बस इतना था कि Claude उससे बहुत अलग न होने वाला एक superset बना दे
      plan बनाने के बाद Fable 5 के 5-hour context में से करीब 10% ही बचा था, और आज मेरा काम बस इतना ही था। बेशक, इसे generalize करना मुश्किल है
    • सही है। Opus से plan लिखवा रहा हूँ और implementation के लिए कई Sonnet sub-agents चला रहा हूँ। सस्ता और तेज़ है
    • Devin Fusion का लक्ष्य ठीक यही है, और अब तक results काफी अच्छे दिख रहे हैं
      https://cognition.com/blog/devin-fusion
    • जानना चाहता हूँ कि किसी ने batch processing आज़माई है या नहीं। https://claude.com/pricing#api के मुताबिक Batch Processing इस्तेमाल करने पर कीमत 50% घट जाती है
      सोच रहा हूँ कि क्या OpenCode/Pi जैसे execution tools को planning जैसे कामों के लिए इसका फायदा उठाने लायक बनाया जा सकता है
    • यही opusplan का idea है
      https://code.claude.com/docs/en/model-config#opusplan-model-...
  • Claude Pro कभी-कभी इस्तेमाल करता हूँ, लेकिन message confusing है। शायद मैं कोई obvious बात miss कर रहा हूँ
    “7 जुलाई तक, आप अपने plan की weekly usage limit का अधिकतम 50% Fable 5 पर खर्च कर सकते हैं” का मतलब क्या यह है कि मेरी subscription में Fable इस्तेमाल करने की सुविधा limited-time promotion है? मैं subscriber हूँ, फिर model सीधे क्यों नहीं इस्तेमाल कर सकता? क्या आगे subscriptions में सिर्फ पुराने models मिलेंगे और नए models के लिए extra payment की ज़रूरत होगी?

    • हाँ
      इसमें लिखा है, “7 जुलाई 2026 के बाद Claude Fable 5 अब plan की weekly usage limit में शामिल नहीं होगा। Claude Fable 5 usage credits के जरिए उपलब्ध रहेगा, और आप plan में शामिल usage से अधिक के लिए payment कर सकते हैं।” long term में इसका क्या मतलब है, पता नहीं। अगर कोई ज़्यादा powerful model आता है या Anthropic की compute capacity बढ़ती है, तो Fable 5 फिर से subscription में शामिल हो सकता है; या यह subscriptions खत्म करने की शुरुआत भी हो सकती है। जब दूसरे providers लगातार बेहतर models निकाल रहे हैं, तो Opus 4.8 तक सीमित subscription के लिए पैसे देना खास समझदारी नहीं लगती
    • ज़्यादा देर भी नहीं लगी
      Dynamic workflow “Multi-lens review of docs/membership-and-friends-model.md with adversarial verification” completed · 25m 59s
      Fable 5 limit तक पहुँच गया
      message आया कि इस हफ्ते शामिल Fable 5 usage खत्म हो गया है, और Fable 5 जारी रखने के लिए usage credits चाहिए
    • initial launch पर कहा गया था कि limited period के लिए subscription के हिस्से के रूप में Fable 5 इस्तेमाल किया जा सकता है, और उसके बाद usage credits की ज़रूरत होगी
      तब यह भी कहा था कि वे किसी समय इसे फिर से subscription plans का हिस्सा बनाना चाहते हैं। इस वापसी में उन्होंने usage period 7 जुलाई तक बढ़ाया, लेकिन usage limit के 50% तक सीमित किया, और यह फिर से नहीं कहा कि वे इसे कभी स्थायी रूप से subscription plans में शामिल करना चाहते हैं। उम्मीद अभी है, लेकिन दिशा निश्चित रूप से अच्छी नहीं लग रही
    • subscriptions में भी नए models तक access मिलता रहेगा। Sonnet 5 तक access मिलना चाहिए, और वह नया model है। बस Mythos-class models API-only हैं
      फिलहाल तो यही है, और ऐसी कंपनियाँ कब बदल जाएँ, कहना मुश्किल है
    • Fable को चलाने की cost ज़्यादा है, और लगता है कि उन्होंने अभी go-to-market strategy तय नहीं की है
      शायद वे देखना चाहते हैं कि लोग वास्तव में कितना इस्तेमाल करते हैं, ताकि तय कर सकें कि Max/Pro plans में इसे subsidize करते रहना worth है या इसके ऊपर कोई extra tier बनाना चाहिए
  • “जब Claude Fable 5 request refuse करता है, तो Messages API error के बजाय successful HTTP 200 response के साथ stop_reason: "refusal" लौटाता है”
    जब मैं “success” सोचता हूँ, तो ठीक यही image दिमाग में आती है

    • HTTP 451 status code इस्तेमाल करने का मौका चूक गए
      https://en.wikipedia.org/wiki/HTTP_451
    • सोच रहा हूँ कि क्या refusal streaming के बीच में भी हो सकता है, status code और headers मिलने के बाद। API में झाँका नहीं है
  • Claude Code terminal में दिखता है कि “7 जुलाई तक plan की weekly usage limit का अधिकतम 50% Fable 5 पर इस्तेमाल किया जा सकता है, limit पहुँचने पर usage credits से जारी रखा जा सकता है, और Fable 5, Opus 4.8 की तुलना में usage को तेज़ी से consume करता है”
    यह 50% rule पहले नहीं था, है न?

    • Opus 4.8, GPT 5.5 की तुलना में बहुत धीमा है, इसलिए थोड़ा बेहतर भी हो तो daily engineering tasks में कोई खास मतलब नहीं
      GPT 5.6 जल्द आएगा, और Codex का $249/month plan अब तक काफी generous रहा है। Fable 5 की नई estimated cost चुकाने के लिए, उसे मेरी पुरानी यादों से कहीं ज़्यादा बेहतर होना पड़ेगा
    • usage भी reset नहीं किया। शुभकामनाएँ
    • 7 जुलाई के बाद सिर्फ usage-based model बचेगा। अब subscription tiers में शामिल नहीं होगा
      सच कहूँ तो शायद बेहतर होता कि इसे वापस लाते ही नहीं। अगर पहले की तरह heavy usage करें, तो cost असल में 20x subscription price से भी 10–20 गुना ज़्यादा हो जाती है
    • पहले ऐसा नहीं था
  • उम्मीद है वे Fable access को subscription plans में वापस शामिल करने पर फिर से विचार करेंगे। कम से कम 20x plan में तो शामिल होना चाहिए
    जब शुरुआती करीब 14 दिन की अवधि announce हुई थी, तब मेरी समझ में वही original intent था, और वे इसे subscription plans में बनाए रखने पर काम कर रहे थे। लेकिन अब तो यह भी नहीं कहा जा रहा कि इस पर अभी चर्चा चल रही है या नहीं

    • market आखिरकार उन्हें इसे वापस शामिल करने पर मजबूर करेगा। अभी शायद capacity constraints हैं, या वे यह तय कर रहे हैं कि subscription में फिट करने के लिए अलग pricing tier चाहिए या नहीं
      शायद unwanted scenario यह है कि कोई हफ्ते में 4 दिन coding करे और हर हफ्ते limit पूरी तरह भर दे
    • यह सिर्फ अगले हफ्ते तक शामिल है
      “Fable 5, 7 जुलाई तक weekly usage limit के अधिकतम 50% तक शामिल है, और उसके बाद usage credits से उपलब्ध होगा” ऐसा लिखा है
 
runai 2 시간 전

क्रेडिट के हिसाब से इसे कौन इस्तेमाल कर पाएगा? महीने का खर्च लाखों won से भी ऊपर जा सकता है, है ना? उससे बेहतर तो GPT के अगले version 5.6 का ही इस्तेमाल कर लेंगे।