1 पॉइंट द्वारा GN⁺ 4 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • अमेरिकी सरकार की Mythos·Fable 5 एक्सेस पाबंदियां लंबी खिंचने पर, जापान की Sakana AI और चीन की 360 ने क्रमशः Fugu और Tulongfeng/Yitianzhen के जरिए बने खालीपन को निशाना बनाया
  • Sakana AI के Fugu को Fable 5·Mythos Preview के साथ प्रतिस्पर्धा करने योग्य मॉडल के रूप में पेश किया गया है, और इसे कई model API को समन्वित करने वाले agent के लिए डिज़ाइन किया गया है
  • चीन की 360 का Tulongfeng सॉफ्टवेयर vulnerabilities की स्वचालित खोज पर, और Yitianzhen cyber defense व incident response automation पर केंद्रित है
  • Sakana AI ने कहा कि लॉन्च का समय संयोग था, लेकिन उसने “export control risk के बिना frontier capability” को आगे रखकर जापानी कंपनियों और सरकारी संस्थानों को लक्षित किया
  • अमेरिकी models की अहमियत अभी भी बनी हुई है, लेकिन export restrictions ने टोक्यो और चीनी कंपनियों को स्थानीय भाषा और संदर्भ के अनुरूप क्षेत्रीय विकल्प तेजी से आगे बढ़ाने का मौका दिया

Anthropic के export restrictions से बना model gap

  • चीनी cybersecurity कंपनी 360 ने बुधवार को Tulongfeng पेश किया, Reuters ने यह रिपोर्ट किया
    • 360 ने कहा कि Tulongfeng, Anthropic के cybersecurity-विशेष AI model Mythos का मुकाबला कर सकता है
    • Mythos और इसका अधिक सीमित संस्करण Fable 5 अभी Trump Administration की कार्रवाई के कारण गैर-अमेरिकी users को उपलब्ध नहीं हैं
  • इसी हफ्ते की शुरुआत में टोक्यो-आधारित Sakana AI ने Fugu लॉन्च किया, जिसका जापानी अर्थ pufferfish होता है
    • Fugu को “Anthropic के Fable 5 और Mythos Preview जैसे अग्रणी models के समकक्ष” बताया गया
    • इसे agents के लिए डिज़ाइन किया गया है और यह दूसरे models की API access को orchestrate कर सकता है
  • दोनों उत्पाद अमेरिकी सरकार के Anthropic-संबंधी आदेश आने के 2 हफ्ते बाद सामने आए

Sakana AI की Fugu रणनीति

  • Sakana AI के प्रवक्ता ने कहा कि Fugu का लॉन्च Mythos/Fable export restrictions के साथ टकराना “entirely coincidental” था
    • हालांकि, कंपनी की वेबसाइट “export control risk के बिना frontier capability” का प्रचार करती है
    • Sakana AI के अनुसार, Fugu पर काम पिछले साल से चल रहा था और संबंधित research इस साल वसंत में ICLR में प्रस्तुत की गई थी
  • कंपनी की 2023 में Google के पूर्व David Ha और Llion Jones, तथा Mercari और Stability AI के पूर्व Ren Ito ने सह-स्थापना की थी
    • यह छोटे datasets पर भी अच्छी तरह काम करने वाले, जापानी भाषा और जापानी संस्कृति के लिए अनुकूलित किफायती generative AI models बनाती है
  • Fugu के लक्ष्य ग्राहक वे जापानी कंपनियां और सरकारी संस्थान हैं जो कड़े होते export controls के जोखिम को कम करना चाहते हैं
    • Sakana AI इसे एशिया के अमेरिकी AI से स्थायी रूप से अलग होने की दिशा नहीं मानती
    • प्रवक्ता ने कहा, “U.S. models remain important to Asia”
  • Ren Ito ने Project Syndicate में लिखे एक लेख में तर्क दिया कि अमेरिकी संघीय सरकार की पहली प्राथमिकता करीबी सहयोगी देशों की पहुंच को बनाए रखना होनी चाहिए, और AI ऐसा technology नहीं होना चाहिए जिसे जमा करके रखा जाए, बल्कि ऐसा technology होना चाहिए जिसे साथ मिलकर विकसित किया जाए
  • David Ha ने X पर लिखा, “Orchestration Models are the next frontier, beyond bigger models
    • उनका मानना है कि राष्ट्रीय infrastructure को किसी एक provider पर निर्भर करना जोखिम भरा है, और हालिया export controls ने इस जोखिम को नजरअंदाज करना असंभव बना दिया है
    • उन्होंने “Access to top models can disappear overnight” लिखते हुए collective intelligence को शक्ति के केंद्रीकरण के खिलाफ एक व्यावहारिक hedge बताया

360 की security AI और strategic asset की दलील

  • Reuters और Quartz की रिपोर्ट के अनुसार 360 ने दो AI security tools पेश किए
    • Tulongfeng: सॉफ्टवेयर vulnerabilities को स्वचालित रूप से खोजने के लिए डिज़ाइन किया गया
    • Yitianzhen: cyber defense और incident response को automate करने के लिए बनाया गया
  • Reuters के अनुसार 360 के संस्थापक Zhou Hongyi vulnerability detection AI को राष्ट्रीय रणनीतिक संपत्ति मानते हैं
    • उन्होंने “one-way transparency” के जोखिम की ओर इशारा किया, जहां केवल कुछ actors को उन्नत vulnerability detection क्षमताओं तक पहुंच मिलती है
  • 360 ने TechCrunch की टिप्पणी मांग पर जवाब नहीं दिया

Anthropic की वृद्धि और क्षेत्रीय विकल्पों का उभार

  • Anthropic ने पहले कहा था कि मई 2026 में उसका annualized revenue 47 अरब डॉलर से ऊपर था
    • इसमें से कितना हिस्सा एशियाई enterprise customers पर निर्भर है, यह सार्वजनिक नहीं किया गया
  • export order लागू होने के बाद के कुछ हफ्तों में Sakana AI और 360 ने Anthropic model access restrictions से बने खाली स्थान में प्रवेश किया
  • भले ही अमेरिकी कंपनियां प्रतिबंध खत्म होने के बाद भरोसा फिर से हासिल कर लें, स्थानीय भाषा और बारीकियों को बेहतर समझने के लिए प्रशिक्षित क्षेत्रीय विकल्प पहले ही इस खालीपन को भरना शुरू कर चुके हैं

1 टिप्पणियां

 
GN⁺ 4 시간 전
Hacker News की राय
  • Fugu मॉडल को C# और Unity में MCP, OpenCode के साथ असली काम में इस्तेमाल करके देखा; theme system review और रंग बदलने की योजना में ही $20 plan की 5 घंटे की limit एक बार में खत्म हो गई
    implementation का नतीजा देखने के लिए $100 plan पर upgrade किया, लेकिन यह Opus से खराब और बेहद धीमा था; नई 5 घंटे की limit भी खत्म हो गई और weekly limit का 35% खर्च हो गया, फिर भी Opus बहुत कम समय और खर्च में जो स्तर देता था, उसके आसपास भी मुश्किल से पहुंचा
    इस जानकारी का आकलन आप खुद करें, लेकिन यह पैसे की बर्बादी जैसा लगता है

    • Fugu कोई स्वतंत्र मॉडल नहीं है; यह पर्दे के पीछे OpenAI, Anthropic जैसे कई मौजूदा SaaS models को call करता है और responses को इकट्ठा करके result बनाता है
      दावा है कि कई AI models के results को combine करने के बाद अपने proprietary model से final result बनाने पर quality किसी single backend model से बेहतर होती है, लेकिन शक होता है कि क्या वह अपना model सच में मौजूद है और पर्याप्त सक्षम है
      भले ही दावा सही हो, Claude Code जैसे client side पर background models जैसी performance वाले model से final result generate करवाकर इसे आसानी से implement किया जा सकता है; service में कुछ suspicious vibe आती है
    • Unity के बजाय Godot के लिए ऐसी ही service देने वाले के रूप में, Opus जैसे top-tier models इस्तेमाल करने पर $20 plan का एक prompt में खत्म हो जाना believable है
      API price ज्यों का त्यों चुकाना पड़े और 10x subsidy संभाल न पाएं, तो ऐसा ही होगा
    • Cursor में Fable को test किया; मैंने पूछा कि मेरे बनाए data website को कम “Claude जैसा” दिखाने के लिए ideas दें, तो उसने 10 मिनट में $40 खर्च करते हुए सबसे बेकार और Claude-जैसी CSS styling निकाल दी
      वह website खुद Opus से बनी थी, इसलिए कहा जा सकता है कि result Opus से खराब था
      US models के साथ भी वही experience हुआ, इसलिए शायद वे Asian models भी Mythos-type हों
    • जानना चाहता हूं कि कौन सा Unity MCP इस्तेमाल कर रहे हैं
      official MCP try कर रहा हूं, और जानना चाहता हूं कि बाकी लोग क्या इस्तेमाल कर रहे हैं
      मशहूर coplay वाले में package conflicts झेलने पड़े
    • web search/research में भी ऐसा ही था, Opus की तुलना में खराब
      आधा miss कर दिया और बाकी आधी जानकारी पुरानी थी या verify नहीं की गई थी
  • Fugu Ultra असल में model नहीं, बल्कि कई models पर route करने वाला system, cloud harness जैसा लगता है, और OpenRouter के Fusion जैसा दिखता है
    “यह कोई single giant model नहीं है; Fugu एक trained multi-agent orchestration system है। यह एक language model है जिसे interchangeable foundation models के pool में tasks route करने और अपने ही instances को recursively call करने के लिए trained किया गया है।” - https://openrouter.ai/sakana/fugu-ultra
    [0] https://sakana.ai/fugu/
    [1] https://openrouter.ai/openrouter/fusion

  • “Mythos-like” expression अब धीरे-धीरे irritate करने लगा है
    आम users के पास benchmarks देखने के अलावा compare करने का कोई तरीका नहीं है

    • “Mythos-like” का मतलब बस rumor-driven hype है, और यहां यह expression सही तरह से इस्तेमाल हुआ है
    • Asian AI startups भी bold claims कर रहे हैं जबकि असल में compare करने का तरीका नहीं है; Trump intervention का core भी शायद Faible को distill करने से रोकना था
    • क्या public benchmarks भी नहीं हैं?
  • अगर reliable benchmarks नहीं हैं, तो वे Mythos जैसे सिर्फ इस मायने में हैं कि text input लेते हैं और text output देते हैं

    • अब benchmarks लगभग नहीं देखता
      नया model आता है तो उसे सीधे हमारे बड़े proprietary systems software codebase और actual released products, या कभी release होने वाले projects पर try करता हूं
      कौन सा model काम बेहतर या तेजी से कराता है, यह काफी साफ हो जाता है, और अभी हमारे पास जरूरत के मुताबिक इस्तेमाल कर सकने लायक token budget है, इसलिए हम lucky हैं
      benchmarks, evaluations, marketing, system cards जैसी चीजों की जरूरत नहीं; web पर सिर्फ tips, practical workflows और release news पढ़ता हूं
      colleagues के साथ experiences share करता हूं, बाकी सब noise है
    • अगर Mythos की तरह overhyped है, तो उसे भी “Mythos-like” list में जोड़ सकते हैं
      शायद जो missing है, वह CEO का दुनिया को warn करना है कि “हमारा model internet पर release करने के लिए बहुत dangerous है, इसलिए बहुत देर होने से पहले किसी को इसे रोकना चाहिए”
    • paper में benchmarks हैं: https://arxiv.org/abs/2606.21228
  • investors की list impressive है: https://sakana.ai/company-info/?lang=en
    कुछ दिन पहले HN headline में भी आया था और comments 100 से ज्यादा थे: https://news.ycombinator.com/item?id=48624782

    • क्या इन companies ने पहले कभी model release किया है?
      अचानक Mythos-level model निकाल दिया, यह मानना मुश्किल है
      DeepSeek, Z.ai, Alibaba/Qwen काफी लंबे समय से इस पर काम कर रहे हैं और पिछले 18 महीनों में लगातार performance improve करने वाले models release करते रहे हैं
      बिना किसी previous release के नई companies ने अचानक Mythos-level model ला दिया, यह believe करना मुश्किल है
    • पिछले साल एक काफी शर्मनाक retraction भी हुआ था
      https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
  • लगता है इस साल के खत्म होने से पहले “safety concerns” के नाम पर foreign LLM ban आ जाएगा
    इसका actual performance से कोई लेना-देना नहीं होगा
    लेकिन Anthropic ने Mythos-type systems की baseline set कर दी है, और उस loosely defined standard पर खरे उतरने वाली चीजों को public के लिए dangerous माना जाएगा

    • असल में यह कैसे काम कर सकता है?
    • अगर ऐसा हुआ तो US tech को अलविदा और China का स्वागत होगा
      कोई इंतजार नहीं करेगा, और जो genie बाहर आ चुका है उसे वापस bottle में नहीं डाला जा सकता
    • यह कहना बेतुका है कि models आगे बढ़ें फिर भी real risk नहीं है
      ऐसा लगता है जैसे मैं किसी दूसरी reality में रह रहा हूं जहां इस समय सिर्फ Claude ही समझदार बातें कर रहा है
      इंसानों द्वारा लिखी लगभग सारी बातें hallucinations और दिखावे वाली बकवास जैसी लगती हैं
  • निंदक नज़रिए से देखें तो, अगर मॉडल बस ठीक-ठाक भी हो, तो Mythos-लेवल होने के दावे को खारिज करना मुश्किल है
    क्योंकि अब Mythos इस्तेमाल नहीं किया जा सकता

    • Mythos जैसी चीज़ आखिर क्या है?
      जिसके पास access नहीं था, उसके तौर पर जानने की उत्सुकता है
  • पहली छाप तो यह है: “third-party benchmark नहीं है तो निकलो”
    निजी तौर पर मैंने इन दोनों कंपनियों के बारे में कभी नहीं सुना
    क्या हम बस उनकी बात मान लें कि ये market के best models के बराबर हैं?
    Sakana अपने model को “Orchestration Model” बताता है, तो क्या इसका मतलब है कि असल में कई models को जोड़कर बनाया गया है?

    • अच्छा model बनाना सच में इतना मुश्किल है, या training में लगाए जाने वाले resources का scale ही मुख्य चीज़ है?
      सच में नहीं पता, इसलिए पूछ रहा हूँ
      जाहिर है यह मामूली काम नहीं होगा, लेकिन जाने-पहचाने existing techniques के ऊपर बनाने के लिए क्या दुनिया के top-level secret knowledge की ज़रूरत होती है?
      लगता है अभी भी explore करने के लिए बहुत सारे low-hanging fruits हैं, और time और resources ही limiting factors हैं
    • हाल में HN पर आए release post के comments का माहौल ऐसा था कि यह असली model से ज़्यादा OpenRouter जैसा है
    • मेरी impression में भी हाँ
      यह किसी नए model mixture से ज़्यादा, किसी dynamic तरीके से on-the-fly glue लगाने वाली structure होने का दावा करता दिखता है
      उस समय की प्रतिक्रिया यहाँ भी देख सकते हैं: https://news.ycombinator.com/item?id=48624782 (6 दिन पहले, 244 points, 133 comments)
    • क्या Anthropic ने third-party benchmarks दिए थे?
      क्या तब भी यही कहा गया था?
      यह अहम तो है, लेकिन attitude गलत है
  • अगर https://arena.ai/leaderboard पर benchmark नहीं है, तो मैं एक सीधा-सादा इंसान हूँ जो इसे 100% scam मानता है

    • ARC AGI से तुलना करें तो कैसा है?
  • यहाँ कई comments की तरह मैंने भी Fugu और कुछ दूसरे models test किए, और वे काफ़ी महंगे models थे
    $20 में पूरा workflow खत्म करना पर्याप्त नहीं था, जबकि Opus में हो गया था
    बेशक अगर best results चाहिए तो Opus में भी शुरुआत से prompt को और refine करना पड़ सकता है, लेकिन अब तक मेरा experience यही रहा है
    अगला test agentic system के तौर पर करके performance देखने वाला हूँ