14 पॉइंट द्वारा GN⁺ 2026-02-26 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • AI रिसर्च कंपनी Anthropic ने अपनी मुख्य सुरक्षा नीति Responsible Scaling Policy(RSP) की एक प्रमुख प्रतिबद्धता वापस ले ली है
  • पहले कंपनी ने वादा किया था कि यदि सुरक्षा उपाय पर्याप्त रूप से सुनिश्चित नहीं किए जा सकें, तो वह AI मॉडल training रोक देगी, लेकिन नई नीति में यह प्रावधान हटा दिया गया है
  • नई RSP transparency बढ़ाने और प्रतिस्पर्धियों के स्तर के बराबर या उससे अधिक सुरक्षा प्रयास करने का वादा करती है, और यह भी कहती है कि जोखिम गंभीर होने पर development को “delay” किया जा सकता है
  • कंपनी का कहना है कि यह बदलाव बाज़ार के दबाव की वजह से नहीं, बल्कि राजनीतिक और वैज्ञानिक वास्तविकताओं के जवाब में किया गया है
  • विशेषज्ञों का मानना है कि यह कदम AI आपदा जोखिमों के लिए सामाजिक तैयारी की कमी का संकेत है

RSP(Responsible Scaling Policy) बदलाव की पृष्ठभूमि

  • Anthropic ने 2023 में यह प्रतिज्ञा घोषित की थी कि यदि सुरक्षा उपाय पर्याप्त रूप से साबित न हों, तो वह AI सिस्टम training नहीं करेगी
    • यह कंपनी की उस छवि को मजबूत करने वाली मुख्य नीति थी जिसमें बाज़ार प्रतिस्पर्धा से ऊपर सुरक्षा को रखा गया था
  • हाल में कंपनी ने RSP का व्यापक पुनर्गठन किया और पूर्व-निश्चित सुरक्षा आश्वासन के बिना मॉडल रिलीज़ नहीं करेगी वाला वादा वापस ले लिया
  • Jared Kaplan(Chief Science Officer) ने कहा कि “AI की प्रगति की गति इतनी तेज़ है कि एकतरफा वादे व्यावहारिक नहीं हैं”

नई नीति के मुख्य बिंदु

  • नई RSP में AI सुरक्षा जोखिमों पर अधिक transparency शामिल है
    • इसमें Anthropic मॉडल के safety test results को अधिक साझा करना और प्रतिस्पर्धियों के स्तर के बराबर या उससे अधिक सुरक्षा उपाय बनाए रखना या उससे आगे जाना शामिल है
  • यदि कंपनी AI प्रतिस्पर्धा में आगे हो और विनाशकारी जोखिम बड़ा माना जाए, तो development को ‘delay’ किया जा सकता है
  • लेकिन पहले की तरह किसी निश्चित स्तर से ऊपर के मॉडल training पर रोक लगाने वाली स्पष्ट सीमा अब नहीं रही

नीति बदलाव का औद्योगिक संदर्भ

  • Anthropic हाल में Claude मॉडल और Claude Code की सफलता के कारण व्यावसायिक उपलब्धियाँ हासिल कर रही है
    • फरवरी 2026 में 30 अरब डॉलर का निवेश, लगभग 3,800 अरब डॉलर का valuation, और वार्षिक revenue growth 10 गुना होने की रिपोर्ट दी गई
  • कंपनी के B2B-केंद्रित business model को OpenAI की consumer-केंद्रित रणनीति की तुलना में अधिक भरोसेमंद माना जाता है
  • Kaplan ने ज़ोर देकर कहा कि यह बदलाव बाज़ार दबाव का परिणाम नहीं, बल्कि राजनीतिक और वैज्ञानिक माहौल में बदलाव के अनुसार किया गया व्यावहारिक समायोजन है

नियमन और वैज्ञानिक सीमाएँ

  • RSP लागू करते समय Anthropic को उम्मीद थी कि दूसरी कंपनियाँ भी इसी तरह के कदम अपनाएँगी, लेकिन ऐसा नहीं हुआ
  • अमेरिका में संघीय स्तर पर AI regulation law की अनुपस्थिति, Trump प्रशासन का deregulation रुख, और अंतरराष्ट्रीय सहयोग की विफलता जारी रही
  • AI evaluation science की जटिलता भी एक समस्या के रूप में सामने आई
    • 2025 में Anthropic ने कहा था कि उसके मॉडल के bioterrorism में दुरुपयोग की संभावना को पूरी तरह खारिज नहीं किया जा सकता, लेकिन इसे साबित करने के लिए पर्याप्त वैज्ञानिक आधार नहीं था

आंतरिक चर्चा और निर्णय प्रक्रिया

  • लगभग एक साल तक प्रबंधन ने नए माहौल के अनुरूप RSP में बदलाव के तरीकों पर चर्चा की
    • मुख्य तर्क यह था कि AI safety research के लिए frontier models को सीधे विकसित करना ज़रूरी है
  • Kaplan के अनुसार, CEO Dario Amodei ने यह निष्कर्ष निकाला कि “अगर प्रतिस्पर्धी development जारी रखते हैं और केवल Anthropic रुक जाए, तो यह उल्टा अधिक खतरनाक हो सकता है”
  • नई RSP की प्रस्तावना में कहा गया है कि “यदि सबसे कमजोर सुरक्षा उपाय वाला developer गति तय करता है, तो ज़िम्मेदार developers अपनी safety research क्षमता खो देंगे”

बाहरी मूल्यांकन और चिंताएँ

  • Chris Painter(METR policy director) ने कहा कि यह बदलाव समझ में आने वाला है, लेकिन यह AI आपदा जोखिमों के लिए सामाजिक तैयारी की कमी को उजागर करता है
    • उन्होंने कहा कि Anthropic ने “risk assessment और mitigation methods तकनीकी प्रगति की गति के साथ कदम नहीं मिला पाने के कारण emergency response mode (triage mode) में शिफ्ट किया है”
  • Painter ने नई नीति की पारदर्शी risk reporting और safety roadmap के प्रकाशन को सकारात्मक बताया, लेकिन
    • उन्होंने चिंता जताई कि पिछली RSP का binary threshold हटने से जोखिम धीरे-धीरे बढ़ने वाला ‘boiling frog effect’ पैदा हो सकता है

आगे की योजना और सार्वजनिक प्रतिबद्धताएँ

  • Anthropic का कहना है कि नई RSP पुरानी नीति के मुख्य फायदे बनाए रखती है
    • पहले मॉडल रिलीज़ पर प्रतिबंध सुरक्षा mitigation विकसित करने की प्रेरणा के रूप में काम करता था
    • नई नीति में भी इस प्रेरणा को बनाए रखने के लिए कंपनी नियमित रूप से ‘Frontier Safety Roadmaps’ प्रकाशित करेगी
  • साथ ही, हर 3~6 महीने में ‘Risk Reports’ जारी किए जाएँगे
    • इनमें मॉडल की capabilities, threat scenarios, risk mitigation measures, और overall risk level का आकलन शामिल होगा
  • Kaplan ने ज़ोर देकर कहा कि “यदि प्रतिस्पर्धी विनाशकारी जोखिमों को लेकर पारदर्शी प्रतिक्रिया देते हैं, तो Anthropic भी बराबर या उससे ऊँचे स्तर के safety standards बनाए रखेगी”

2 टिप्पणियां

 
tsboard 2026-02-26

Anthropic चाहे जितनी ज़िद कर ले, आखिरकार अगर अमेरिकी रक्षा विभाग कहे तो उसे मानना ही पड़ेगा। क्या आखिरकार यह ऐसा ही होना तय नहीं था?

 
GN⁺ 2026-02-26
Hacker News की राय
  • Anthropic ने AI मॉडल ट्रेनिंग रोकने की प्रतिज्ञा वापस लेने की वजह यह बताई कि “प्रतिद्वंद्वी आगे निकल रहे हैं”, यह देखकर लगा कि आखिरकार बात पैसे की ही है
    यह तर्क कुछ ऐसा लगता है: “अगर सब लोग कुत्ते को लात मार रहे हैं, तो हमें भी मारनी चाहिए।”
    लोगों को लगता था कि Anthropic एक ‘अच्छी कंपनी’ है, लेकिन आखिर में वह भी बाकी सबकी तरह सिर्फ मुनाफ़े के पीछे भागने वाली निकली

    • Anthropic बाज़ार की समझदारी का प्रतिनिधित्व नहीं कर सकती। वह भूमिका सरकारी विनियमन और निगरानी व्यवस्था को निभानी चाहिए
      लेकिन हक़ीक़त यह है कि ज़्यादातर AI कंपनियाँ सिर्फ ‘काग़ज़ पर मौजूद सरकार’ के अधीन हैं
    • सच तो यह है कि “सिर्फ जीतना ही मायने रखता है” लगभग हर उद्योग की साझा हक़ीक़त है
      यह सिर्फ AI कंपनियों की समस्या नहीं है, लेकिन इससे इसे सही नहीं ठहराया जा सकता
    • अगर आख़िर में पैसा ही सब कुछ है, तो मैंने अपने बटुए से वोट देने का फ़ैसला किया और Max सब्सक्रिप्शन रद्द कर दिया
    • अगर प्रतिस्पर्धा को बिना विनियमन के खुला छोड़ दिया जाए, तो अंत में हर सफल कंपनी धोखाधड़ी और नुकसान पहुँचाने लगती है
      इसलिए safety, environment, और anti-corruption regulations ज़रूरी हैं
  • यह AI startup का एक टिपिकल चक्र लगता है
    “मानवता को बचाने के लिए moat बनाओ” → “open source प्रतिस्पर्धियों को regulate करो” → “safety Q3 earnings में बाधा है”

    • आखिर में बात वहीं पहुँचती है कि “safety से ज़्यादा Pentagon का budget मायने रखता है”
    • बाज़ार पर कब्ज़ा करने के बाद ये लोग अपने समर्थित nonprofit संगठनों के ज़रिए सरकारी regulation को आगे बढ़ाएँगे
    • हैरानी की बात यह है कि यह बदलाव बहुत जल्दी आ गया
    • सिर्फ AI ही नहीं, “open” शब्द को आगे रखने वाली दूसरी कंपनियाँ भी ऐसी ही हैं
      असल में वे बंद होती हैं, लेकिन खुद को “खुला” बताकर gaslighting करती हैं
    • राजनेताओं को भी regulation पसंद है, ख़ासकर जब साथ में wine और steak भी हो — यह उसी पर एक व्यंग्यात्मक टिप्पणी है
  • मैं पहले Anthropic में काम कर चुका हूँ, और Jared Kaplan जैसे लोग सच में safety research और frontier technology के संतुलन पर गंभीरता से सोचते थे
    लेकिन यह फ़ैसला निराशाजनक है। मुझे लगा था कि ‘Responsible Scaling Policy’ ऐसी स्थिति में भी निभाई जाने वाली वास्तविक प्रतिबद्धता है
    उसी प्रतिबद्धता ने Anthropic को “सबसे कम ख़तरनाक लैब” जैसा दिखाया था, लेकिन अब वह संकेत कमज़ोर पड़ गया है
    अब चिंता यह है कि कहीं आगे चलकर सिद्धांतों से ज़्यादा अपनी जगह बचाए रखना प्राथमिकता न बन जाए

    • “हम चाहते हैं कि वे अपने मूल्यों के अनुसार चलें” कहना शायद बहुत भोली उम्मीद हो सकती है
      फिर भी अगर कुछ मूल्य अब भी बचे हैं, तो पूरी तरह मूल्यहीन लैब्स के बीच रहकर भी असर डालना बेहतर है
    • अगर हम खुद RSU (stock compensation) छोड़ने को तैयार नहीं हैं, तो management से भी वही उम्मीद नहीं कर सकते
      नैतिक ज़िम्मेदारी हम सबको साझा करनी होगी
    • यह प्रतिज्ञा क़ानूनी रूप से बाध्यकारी नहीं थी, लेकिन बाज़ार को भेजे जाने वाले संकेत के रूप में उसका महत्व था
      उस संकेत को खुद वापस लेना यह बताता है कि अब वे किसी दूसरे बाज़ार की ओर बढ़ना चाहते हैं
    • मैंने पिछले साल Anthropic का इंटरव्यू दिया था, और वह एक ethics show जैसा लगा
      उम्मीदवारों से AI safety पर essay लिखवाया जाता था, और सब लोग “दुनिया बचाने” का नाटक कर रहे थे
      लेकिन अब जब पैसे की बात आई, तो कोई कुछ बोलता नहीं
    • ऐसे सिद्धांत आख़िरकार सिर्फ सरकारी स्तर पर ही टिक सकते हैं
      क्योंकि कंपनियाँ संरचनात्मक रूप से मुनाफ़ा अधिकतम करने की प्रवृत्ति से बाहर नहीं निकल सकतीं
  • यह फ़ैसला Mozilla के DRM अपनाने वाले पल जैसा लगता है
    यह परफ़ेक्ट नहीं है, लेकिन फिर भी Anthropic कम से कम ज़िम्मेदारी लेने की कोशिश तो कर रही है
    OpenAI की तुलना में अभी भी उस पर भरोसे की कुछ गुंजाइश है

  • लेख का शीर्षक बढ़ा-चढ़ाकर लिखा गया है। यह विवाद Pentagon के साथ बातचीत के बारे में नहीं, बल्कि Anthropic द्वारा जारी Responsible Scaling Policy 3.0 के बारे में है

    • बेशक, यह पक्का नहीं कहा जा सकता कि दोनों बातें पूरी तरह असंबंधित हैं
      बल्कि यह एक पूर्व-सावधानी वाला कदम भी हो सकता है
    • मेरे हिसाब से Pentagon वाले मुद्दे से ज़्यादा यह policy change ज़्यादा बड़ा बदलाव है
  • सरकार का दबाव था, लेकिन लेख में उसका ज़िक्र ही नहीं है

    • संबंधित रिपोर्ट के मुताबिक, Hegseth और Anthropic CEO Dario Amodei की मुलाकात की पुष्टि हुई थी
    • इसलिए कुछ लोगों का मानना है कि शायद इसी वजह से उन्हें exclusive report मिली
    • कुछ लोग इसे जनमत निर्माण (Consent manufacturing) मानते हैं
    • लेख में Hegseth का नाम तक न होना भी आलोचना का विषय है
  • “शुरुआत में जब मॉडल बिना safety validation के रिलीज़ किए गए, तब किसी ने कुछ नहीं कहा…” से शुरू होने वाली बात एक चेतावनी भरी दंतकथा जैसी लगती है
    आख़िर में किसी ने तैयारी नहीं की, और जब समस्या फूटी तब बहुत देर हो चुकी थी

    • ऐसा सामूहिक अनदेखापन मानव समाज की पुरानी समस्या है
    • चेतावनियाँ काफ़ी थीं, लेकिन लोग लालच और अल्पकालिक सोच में फँसे रहे
    • HN-शैली में कहें तो, आख़िरकार हम सब उस सिस्टम के सह-अपराधी थे
    • कुछ लोगों ने कहा कि यह थोड़ा Terminator narrative की प्रस्तावना जैसा लगता है
    • लेकिन व्यावहारिक रूप से देखें तो AI के पूरी तरह नियंत्रण से बाहर हो जाने वाला परिदृश्य अभी दूर है
      असली समस्या तकनीक से ज़्यादा राजनीति और संस्कृति के क्षेत्र में है
  • इस समय safety pledge वापस लेना काफ़ी अर्थपूर्ण है
    ऐसी कंपनियाँ ethical code का पालन करती दिखती हैं, लेकिन जैसे ही मुनाफ़े को ख़तरा होता है, उसे तुरंत छोड़ देती हैं
    आख़िरकार लक्ष्य white-collar labor का अवमूल्यन है
    क्या वे इस बदलाव को नैतिक तरीके से आगे बढ़ाएँगे, या फिर संपत्ति को shareholders की तरफ़ मोड़ देंगे?

    • यह timing सरकारी दबाव का शुरुआती संकेत भी हो सकती है
    • लेकिन अगर middle class टूट जाती है, तो आख़िर में consumer base भी ग़ायब हो जाएगा
      यह साँप के खुद अपनी पूँछ खाने जैसा होगा
    • “Don’t be evil” जैसे नारे आख़िर में सिर्फ मुनाफ़े के लिए पैकेजिंग होते हैं
      कंपनी का मूल स्वभाव मुनाफ़ा कमाना है, और वह अपने आप में बुरा नहीं है, लेकिन नैतिक इशारे पाखंडी लगते हैं
  • Google का “Don’t be evil” 15 साल चला, लेकिन Anthropic की Responsible Scaling Policy ढाई साल में ही ग़ायब हो गई
    AI idealism का half-life लगातार छोटा होता जा रहा है

  • Anthropic का बदलाव निराशाजनक है, लेकिन व्यावहारिक रूप से देखें तो safety के लिए भी प्रतिस्पर्धा में बहुत पीछे नहीं रहना चाहिए
    अभी pragmatism की ज़रूरत है। आगे चलकर Anthropic “बुरी” बन सकती है, लेकिन अभी भी वह सबसे सुरक्षित विकल्प लगती है

    • कुछ लोगों ने पूछा भी कि Anthropic पर इतना भरोसा क्यों किया जाए
      CEO ने युद्ध में इस्तेमाल होने वाली AI को ठुकराया था, इसे कुछ लोग सकारात्मक मानते हैं
    • लेकिन यह बदलाव शायद पहले से ही बिगड़ने का संकेत हो सकता है
      बहुत देर होने से पहले सतर्क हो जाना चाहिए
    • एक निंदक प्रतिक्रिया यह भी थी कि दुनिया हमेशा practical लोगों की वजह से ही बिगड़ती है