एशियाई AI स्टार्टअप्स ने Anthropic Mythos के विकल्प मॉडल लॉन्च किए
(techcrunch.com)- अमेरिकी सरकार की Mythos·Fable 5 एक्सेस पाबंदियां लंबी खिंचने पर, जापान की Sakana AI और चीन की 360 ने क्रमशः Fugu और Tulongfeng/Yitianzhen के जरिए बने खालीपन को निशाना बनाया
- Sakana AI के Fugu को Fable 5·Mythos Preview के साथ प्रतिस्पर्धा करने योग्य मॉडल के रूप में पेश किया गया है, और इसे कई model API को समन्वित करने वाले agent के लिए डिज़ाइन किया गया है
- चीन की 360 का Tulongfeng सॉफ्टवेयर vulnerabilities की स्वचालित खोज पर, और Yitianzhen cyber defense व incident response automation पर केंद्रित है
- Sakana AI ने कहा कि लॉन्च का समय संयोग था, लेकिन उसने “export control risk के बिना frontier capability” को आगे रखकर जापानी कंपनियों और सरकारी संस्थानों को लक्षित किया
- अमेरिकी models की अहमियत अभी भी बनी हुई है, लेकिन export restrictions ने टोक्यो और चीनी कंपनियों को स्थानीय भाषा और संदर्भ के अनुरूप क्षेत्रीय विकल्प तेजी से आगे बढ़ाने का मौका दिया
Anthropic के export restrictions से बना model gap
- चीनी cybersecurity कंपनी 360 ने बुधवार को Tulongfeng पेश किया, Reuters ने यह रिपोर्ट किया
- 360 ने कहा कि Tulongfeng, Anthropic के cybersecurity-विशेष AI model Mythos का मुकाबला कर सकता है
- Mythos और इसका अधिक सीमित संस्करण Fable 5 अभी Trump Administration की कार्रवाई के कारण गैर-अमेरिकी users को उपलब्ध नहीं हैं
- इसी हफ्ते की शुरुआत में टोक्यो-आधारित Sakana AI ने Fugu लॉन्च किया, जिसका जापानी अर्थ pufferfish होता है
- Fugu को “Anthropic के Fable 5 और Mythos Preview जैसे अग्रणी models के समकक्ष” बताया गया
- इसे agents के लिए डिज़ाइन किया गया है और यह दूसरे models की API access को orchestrate कर सकता है
- दोनों उत्पाद अमेरिकी सरकार के Anthropic-संबंधी आदेश आने के 2 हफ्ते बाद सामने आए
Sakana AI की Fugu रणनीति
- Sakana AI के प्रवक्ता ने कहा कि Fugu का लॉन्च Mythos/Fable export restrictions के साथ टकराना “entirely coincidental” था
- हालांकि, कंपनी की वेबसाइट “export control risk के बिना frontier capability” का प्रचार करती है
- Sakana AI के अनुसार, Fugu पर काम पिछले साल से चल रहा था और संबंधित research इस साल वसंत में ICLR में प्रस्तुत की गई थी
- कंपनी की 2023 में Google के पूर्व David Ha और Llion Jones, तथा Mercari और Stability AI के पूर्व Ren Ito ने सह-स्थापना की थी
- यह छोटे datasets पर भी अच्छी तरह काम करने वाले, जापानी भाषा और जापानी संस्कृति के लिए अनुकूलित किफायती generative AI models बनाती है
- Fugu के लक्ष्य ग्राहक वे जापानी कंपनियां और सरकारी संस्थान हैं जो कड़े होते export controls के जोखिम को कम करना चाहते हैं
- Sakana AI इसे एशिया के अमेरिकी AI से स्थायी रूप से अलग होने की दिशा नहीं मानती
- प्रवक्ता ने कहा, “U.S. models remain important to Asia”
- Ren Ito ने Project Syndicate में लिखे एक लेख में तर्क दिया कि अमेरिकी संघीय सरकार की पहली प्राथमिकता करीबी सहयोगी देशों की पहुंच को बनाए रखना होनी चाहिए, और AI ऐसा technology नहीं होना चाहिए जिसे जमा करके रखा जाए, बल्कि ऐसा technology होना चाहिए जिसे साथ मिलकर विकसित किया जाए
- David Ha ने X पर लिखा, “Orchestration Models are the next frontier, beyond bigger models”
- उनका मानना है कि राष्ट्रीय infrastructure को किसी एक provider पर निर्भर करना जोखिम भरा है, और हालिया export controls ने इस जोखिम को नजरअंदाज करना असंभव बना दिया है
- उन्होंने “Access to top models can disappear overnight” लिखते हुए collective intelligence को शक्ति के केंद्रीकरण के खिलाफ एक व्यावहारिक hedge बताया
360 की security AI और strategic asset की दलील
- Reuters और Quartz की रिपोर्ट के अनुसार 360 ने दो AI security tools पेश किए
- Tulongfeng: सॉफ्टवेयर vulnerabilities को स्वचालित रूप से खोजने के लिए डिज़ाइन किया गया
- Yitianzhen: cyber defense और incident response को automate करने के लिए बनाया गया
- Reuters के अनुसार 360 के संस्थापक Zhou Hongyi vulnerability detection AI को राष्ट्रीय रणनीतिक संपत्ति मानते हैं
- उन्होंने “one-way transparency” के जोखिम की ओर इशारा किया, जहां केवल कुछ actors को उन्नत vulnerability detection क्षमताओं तक पहुंच मिलती है
- 360 ने TechCrunch की टिप्पणी मांग पर जवाब नहीं दिया
Anthropic की वृद्धि और क्षेत्रीय विकल्पों का उभार
- Anthropic ने पहले कहा था कि मई 2026 में उसका annualized revenue 47 अरब डॉलर से ऊपर था
- इसमें से कितना हिस्सा एशियाई enterprise customers पर निर्भर है, यह सार्वजनिक नहीं किया गया
- export order लागू होने के बाद के कुछ हफ्तों में Sakana AI और 360 ने Anthropic model access restrictions से बने खाली स्थान में प्रवेश किया
- भले ही अमेरिकी कंपनियां प्रतिबंध खत्म होने के बाद भरोसा फिर से हासिल कर लें, स्थानीय भाषा और बारीकियों को बेहतर समझने के लिए प्रशिक्षित क्षेत्रीय विकल्प पहले ही इस खालीपन को भरना शुरू कर चुके हैं
1 टिप्पणियां
Hacker News की राय
Fugu मॉडल को C# और Unity में MCP, OpenCode के साथ असली काम में इस्तेमाल करके देखा; theme system review और रंग बदलने की योजना में ही $20 plan की 5 घंटे की limit एक बार में खत्म हो गई
implementation का नतीजा देखने के लिए $100 plan पर upgrade किया, लेकिन यह Opus से खराब और बेहद धीमा था; नई 5 घंटे की limit भी खत्म हो गई और weekly limit का 35% खर्च हो गया, फिर भी Opus बहुत कम समय और खर्च में जो स्तर देता था, उसके आसपास भी मुश्किल से पहुंचा
इस जानकारी का आकलन आप खुद करें, लेकिन यह पैसे की बर्बादी जैसा लगता है
दावा है कि कई AI models के results को combine करने के बाद अपने proprietary model से final result बनाने पर quality किसी single backend model से बेहतर होती है, लेकिन शक होता है कि क्या वह अपना model सच में मौजूद है और पर्याप्त सक्षम है
भले ही दावा सही हो, Claude Code जैसे client side पर background models जैसी performance वाले model से final result generate करवाकर इसे आसानी से implement किया जा सकता है; service में कुछ suspicious vibe आती है
API price ज्यों का त्यों चुकाना पड़े और 10x subsidy संभाल न पाएं, तो ऐसा ही होगा
वह website खुद Opus से बनी थी, इसलिए कहा जा सकता है कि result Opus से खराब था
US models के साथ भी वही experience हुआ, इसलिए शायद वे Asian models भी Mythos-type हों
official MCP try कर रहा हूं, और जानना चाहता हूं कि बाकी लोग क्या इस्तेमाल कर रहे हैं
मशहूर coplay वाले में package conflicts झेलने पड़े
आधा miss कर दिया और बाकी आधी जानकारी पुरानी थी या verify नहीं की गई थी
Fugu Ultra असल में model नहीं, बल्कि कई models पर route करने वाला system, cloud harness जैसा लगता है, और OpenRouter के Fusion जैसा दिखता है
“यह कोई single giant model नहीं है; Fugu एक trained multi-agent orchestration system है। यह एक language model है जिसे interchangeable foundation models के pool में tasks route करने और अपने ही instances को recursively call करने के लिए trained किया गया है।” - https://openrouter.ai/sakana/fugu-ultra
[0] https://sakana.ai/fugu/
[1] https://openrouter.ai/openrouter/fusion
“Mythos-like” expression अब धीरे-धीरे irritate करने लगा है
आम users के पास benchmarks देखने के अलावा compare करने का कोई तरीका नहीं है
अगर reliable benchmarks नहीं हैं, तो वे Mythos जैसे सिर्फ इस मायने में हैं कि text input लेते हैं और text output देते हैं
नया model आता है तो उसे सीधे हमारे बड़े proprietary systems software codebase और actual released products, या कभी release होने वाले projects पर try करता हूं
कौन सा model काम बेहतर या तेजी से कराता है, यह काफी साफ हो जाता है, और अभी हमारे पास जरूरत के मुताबिक इस्तेमाल कर सकने लायक token budget है, इसलिए हम lucky हैं
benchmarks, evaluations, marketing, system cards जैसी चीजों की जरूरत नहीं; web पर सिर्फ tips, practical workflows और release news पढ़ता हूं
colleagues के साथ experiences share करता हूं, बाकी सब noise है
शायद जो missing है, वह CEO का दुनिया को warn करना है कि “हमारा model internet पर release करने के लिए बहुत dangerous है, इसलिए बहुत देर होने से पहले किसी को इसे रोकना चाहिए”
investors की list impressive है: https://sakana.ai/company-info/?lang=en
कुछ दिन पहले HN headline में भी आया था और comments 100 से ज्यादा थे: https://news.ycombinator.com/item?id=48624782
अचानक Mythos-level model निकाल दिया, यह मानना मुश्किल है
DeepSeek, Z.ai, Alibaba/Qwen काफी लंबे समय से इस पर काम कर रहे हैं और पिछले 18 महीनों में लगातार performance improve करने वाले models release करते रहे हैं
बिना किसी previous release के नई companies ने अचानक Mythos-level model ला दिया, यह believe करना मुश्किल है
https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
लगता है इस साल के खत्म होने से पहले “safety concerns” के नाम पर foreign LLM ban आ जाएगा
इसका actual performance से कोई लेना-देना नहीं होगा
लेकिन Anthropic ने Mythos-type systems की baseline set कर दी है, और उस loosely defined standard पर खरे उतरने वाली चीजों को public के लिए dangerous माना जाएगा
कोई इंतजार नहीं करेगा, और जो genie बाहर आ चुका है उसे वापस bottle में नहीं डाला जा सकता
ऐसा लगता है जैसे मैं किसी दूसरी reality में रह रहा हूं जहां इस समय सिर्फ Claude ही समझदार बातें कर रहा है
इंसानों द्वारा लिखी लगभग सारी बातें hallucinations और दिखावे वाली बकवास जैसी लगती हैं
निंदक नज़रिए से देखें तो, अगर मॉडल बस ठीक-ठाक भी हो, तो Mythos-लेवल होने के दावे को खारिज करना मुश्किल है
क्योंकि अब Mythos इस्तेमाल नहीं किया जा सकता
जिसके पास access नहीं था, उसके तौर पर जानने की उत्सुकता है
पहली छाप तो यह है: “third-party benchmark नहीं है तो निकलो”
निजी तौर पर मैंने इन दोनों कंपनियों के बारे में कभी नहीं सुना
क्या हम बस उनकी बात मान लें कि ये market के best models के बराबर हैं?
Sakana अपने model को “Orchestration Model” बताता है, तो क्या इसका मतलब है कि असल में कई models को जोड़कर बनाया गया है?
सच में नहीं पता, इसलिए पूछ रहा हूँ
जाहिर है यह मामूली काम नहीं होगा, लेकिन जाने-पहचाने existing techniques के ऊपर बनाने के लिए क्या दुनिया के top-level secret knowledge की ज़रूरत होती है?
लगता है अभी भी explore करने के लिए बहुत सारे low-hanging fruits हैं, और time और resources ही limiting factors हैं
यह किसी नए model mixture से ज़्यादा, किसी dynamic तरीके से on-the-fly glue लगाने वाली structure होने का दावा करता दिखता है
उस समय की प्रतिक्रिया यहाँ भी देख सकते हैं: https://news.ycombinator.com/item?id=48624782 (6 दिन पहले, 244 points, 133 comments)
क्या तब भी यही कहा गया था?
यह अहम तो है, लेकिन attitude गलत है
अगर https://arena.ai/leaderboard पर benchmark नहीं है, तो मैं एक सीधा-सादा इंसान हूँ जो इसे 100% scam मानता है
यहाँ कई comments की तरह मैंने भी Fugu और कुछ दूसरे models test किए, और वे काफ़ी महंगे models थे
$20 में पूरा workflow खत्म करना पर्याप्त नहीं था, जबकि Opus में हो गया था
बेशक अगर best results चाहिए तो Opus में भी शुरुआत से prompt को और refine करना पड़ सकता है, लेकिन अब तक मेरा experience यही रहा है
अगला test agentic system के तौर पर करके performance देखने वाला हूँ