- चीन की प्रमुख AI रिसर्च लैब्स का सीधे दौरा करने और शोधकर्ताओं से बातचीत के अनुभव के आधार पर, चीन-अमेरिका AI इकोसिस्टम के सांस्कृतिक अंतर और उनका मॉडल विकास पर प्रभाव का विश्लेषण करने वाली एक ग्राउंड रिपोर्ट
- चीनी शोधकर्ता व्यक्तिगत प्रतिष्ठा से अधिक अंतिम मॉडल की गुणवत्ता के अनुकूलन पर केंद्रित रहने की सांस्कृतिक प्रवृत्ति दिखाते हैं, और मुख्य योगदानकर्ताओं में बड़ी संख्या सक्रिय छात्रों की है
- चीनी AI कंपनियां बाहरी सेवाएं खरीदने के बजाय अपने तकनीकी स्टैक को नियंत्रित करने की मजबूत स्वामित्व भावना रखती हैं, और open source रिलीज़ भी व्यावहारिक निर्णयों पर आधारित होती है
- अधिकांश चीनी AI डेवलपर Claude का उपयोग कर रहे हैं, और enterprise AI demand के SaaS नहीं बल्कि cloud market के रास्ते पर चलने की संभावना है
- अमेरिका और चीन के AI इकोसिस्टम संरचनात्मक रूप से अलग ढंग से काम करते हैं, और पश्चिमी फ्रेमवर्क से चीनी AI उद्योग को सीधे मैप करना category error पैदा कर सकता है
चीनी शोधकर्ताओं की सोच
- चीन की LLM डेवलपमेंट कंपनियां शिक्षा और कामकाज की पुरानी सांस्कृतिक परंपराओं को टेक कंपनियों के संचालन के सूक्ष्म अंतर के साथ जोड़कर fast-follower के रूप में एक उपयुक्त संरचना रखती हैं
- अत्याधुनिक LLM बनाना डेटा, architecture की बारीकियां, RL algorithm implementation जैसे पूरे stack में फैले सूक्ष्म काम पर निर्भर है, और यह एक जटिल प्रक्रिया है जिसमें पूरे मॉडल के बहुउद्देश्यीय optimization के लिए व्यक्तिगत योगदानकर्ताओं की उपलब्धियों को पीछे रखना पड़ता है
- अमेरिकी शोधकर्ताओं में अपने काम का सक्रिय प्रचार करने की संस्कृति अधिक मजबूत है, और "leading AI scientist" के रूप में प्रतिष्ठा पाने की चाह संगठन के भीतर टकराव पैदा करती है
- यह अफवाह व्यापक है कि Llama संगठन ऐसे राजनीतिक हितों के बोझ से बिखर गया
- कुछ लैब्स में ऐसी कहानियां भी हैं कि अंतिम मॉडल में अपने विचार शामिल न होने पर असंतोष जताने वाले शीर्ष शोधकर्ताओं को मुआवज़ा देना पड़ा
- चीनी लैब्स के प्रमुख योगदानकर्ताओं में बड़ी संख्या सक्रिय छात्रों की है, और लैब्स स्वयं भी बहुत युवा संगठन हैं
- यह Ai2 की संरचना जैसा है, जहां छात्रों को सहकर्मियों की तरह माना जाता है और सीधे LLM टीमों में जोड़ा जाता है
- दूसरी ओर अमेरिका में OpenAI, Anthropic, Cursor आदि internship नहीं देते, और Google की Gemini-संबंधित internships भी वास्तविक काम से अलग रहने का जोखिम रखती हैं
- ऐसे सांस्कृतिक अंतर मॉडल निर्माण क्षमता को जिन ठोस तरीकों से बेहतर बनाते हैं:
- अंतिम मॉडल को बेहतर बनाने के लिए कम दृश्यता वाले काम को स्वीकार करने की उच्च प्रवृत्ति
- AI में आने वाले नए लोग पिछले hype cycle से बंधे नहीं होते, इसलिए आधुनिक तकनीकों के साथ जल्दी अनुकूलित हो जाते हैं
- ego कम होने से संगठनात्मक संरचना कुछ अधिक scalable बनती है, और system gamification भी कम होती है
- उन समस्याओं को हल करने के लिए उपयुक्त बड़ा talent pool, जिनका concept कहीं और पहले ही प्रमाणित हो चुका है
- ये ताकतें उस प्रचलित धारणा के विपरीत हैं कि चीनी शोधकर्ता रचनात्मक और 0-to-1 शैली के क्षेत्र-निर्माता अकादमिक शोध कम करते हैं
- अकादमिक लैब्स के नेता अधिक महत्वाकांक्षी शोध संस्कृति विकसित करने की कोशिश कर रहे हैं
- कुछ तकनीकी नेताओं का मानना है कि शिक्षा और incentive system को फिर से डिज़ाइन करना मौजूदा आर्थिक संतुलन के भीतर बहुत बड़ा काम है
छात्र शोधकर्ताओं की विशेषताएं
- चीन में भी अमेरिका की तरह brain drain हो रहा है, और पहले जो लोग अकादमिक क्षेत्र पर विचार करते थे, उनमें से कई अब उद्योग में बने रहना चाहते हैं
- एक शोधकर्ता ने कहा कि उसे प्रोफेसर बनने में रुचि थी, लेकिन "शिक्षण तो LLM से हो जाएगा — छात्र मुझसे सवाल ही क्यों पूछेंगे"
- छात्रों को LLM के प्रति पूर्वाग्रह-मुक्त दृष्टिकोण रखने का लाभ है
- हाल के वर्षों में LLM का मुख्य paradigm MoE scaling → RL scaling → agent उपयोग की ओर बदला है
- यह सब अच्छी तरह करने के लिए व्यापक literature और तकनीकी stack का संदर्भ जल्दी आत्मसात करना पड़ता है, और छात्र इस काम के अभ्यस्त और उत्साही होते हैं
- चीनी छात्र शोधकर्ता दार्शनिक विमर्श में कम शामिल होते हैं और बहुत सीधे होते हैं
- मॉडल की economics या दीर्घकालिक सामाजिक जोखिमों पर परिष्कृत राय रखने वाले चीनी शोधकर्ता, अमेरिका की तुलना में बहुत कम हैं
- एक शोधकर्ता ने Dan Wang की प्रसिद्ध पंक्ति उद्धृत की: "चीन को engineer चलाते हैं, और अमेरिका को lawyer चलाते हैं"
- चीन में Dwarkesh या Lex जैसे mega-mainstream podcasts के ज़रिए वैज्ञानिकों की स्टार-पावर को व्यवस्थित रूप से बढ़ाने वाला ट्रैक मौजूद नहीं है
- AI से पैदा होने वाली आर्थिक अनिश्चितता, AGI से आगे के सवाल, या मॉडल व्यवहार पर नैतिक बहसों जैसे प्रश्नों पर चीनी वैज्ञानिकों की प्रतिक्रिया उस प्रणाली की छाप दिखाती है जिसमें बहस और सामाजिक संरचना पर राय देना प्रोत्साहित नहीं किया जाता
बीजिंग और चीन के AI इकोसिस्टम का ज़मीनी माहौल
- बीजिंग, Bay Area की तरह बहुत समान महसूस होता है, जहां प्रतिस्पर्धी लैब्स पैदल या छोटी दूरी की यात्रा के भीतर स्थित हैं
- 36 घंटों में Z.ai, Moonshot AI, Tsinghua University, Meituan, Xiaomi, 01.ai का दौरा किया गया
- Didi से यात्रा सुविधाजनक है, और चीन में XL गाड़ियों के रूप में अक्सर मसाज सीटों वाली इलेक्ट्रिक मिनीवैन मिल जाती हैं
- शोधकर्ताओं के लिए talent war अमेरिका जैसी ही है, और शोधकर्ताओं का नौकरी बदलना सामान्य है; चयन का मानदंड अक्सर जहां इस समय सबसे अच्छा माहौल हो वही होता है
- चीन का LLM समुदाय प्रतिस्पर्धी कबीलों से अधिक एक इकोसिस्टम जैसा लगता है
- सभी चीनी लैब्स लोकप्रिय Doubao मॉडल रखने वाली ByteDance को लेकर सतर्क हैं
- ByteDance चीन की एकमात्र frontier private lab है
- सभी लैब्स DeepSeek को execution में सर्वश्रेष्ठ research sense रखने वाला तकनीकी नेता मानती हैं
- यह अमेरिका के विपरीत है, जहां अनौपचारिक रूप से लैब सदस्यों से मिलते ही जल्दी चिंगारियां निकलने लगती हैं
- चीनी शोधकर्ताओं की विनम्रता का सबसे प्रभावशाली पहलू यह था कि वे बिज़नेस पक्ष को "मेरी समस्या नहीं" कहकर लगभग नज़रअंदाज़ करते हैं
- अमेरिका में हर कोई data vendors, compute, fundraising जैसे इकोसिस्टम-स्तरीय इंडस्ट्री ट्रेंड्स पर केंद्रित रहता है
चीनी AI उद्योग की भिन्नताएं और समानताएं
- आज AI मॉडल बनाना केवल उत्कृष्ट शोधकर्ताओं की engineering output नहीं रह गया है, बल्कि यह निर्माण, deployment, funding और adoption के मेल से बना एक जटिल काम है
- पश्चिमी इकोसिस्टम से 6 प्रमुख अंतर:
-
1. घरेलू AI demand के शुरुआती संकेत
- एक परिकल्पना है कि चीनी कंपनियां software पर खर्च नहीं करतीं, इसलिए वहां विशाल inference market नहीं बनेगा
- यह ऐतिहासिक रूप से चीन के छोटे SaaS इकोसिस्टम के लिए सही रहा है, लेकिन चीन में अब भी बड़ा cloud market मौजूद है
- मुख्य अनसुलझा सवाल: enterprise AI spending, SaaS market (छोटा) का अनुसरण करेगी या cloud market (मौलिक) का
- कुल मिलाकर AI, cloud के अधिक नज़दीकी trajectory पर दिखता है, और किसी ने भी नए tools के आसपास बाज़ार बढ़ने को लेकर विशेष चिंता नहीं जताई
-
2. अधिकांश डेवलपर Claude का उपयोग करते हैं
- चीन के अधिकांश AI डेवलपर Claude को लेकर उत्साहित हैं, और यह कि Claude ने software बनाने का तरीका कैसे बदला, इसी पर ध्यान देते हैं
- Claude का उपयोग तब भी हो रहा है जबकि वह नाममात्र रूप से चीन में प्रतिबंधित है
- कुछ शोधकर्ताओं ने Kimi या GLM CLI जैसे अपने tools के उपयोग का ज़िक्र किया, लेकिन सभी ने Claude का नाम लिया
- Bay Area में तेजी से लोकप्रिय हो रहे Codex का उल्लेख हैरान करने वाली तरह कम था
- भले ही चीन ऐतिहासिक रूप से software खरीदने में संकोची रहा हो, लेकिन इससे inference demand में बड़े उछाल की कमी का आभास नहीं मिलता
-
3. तकनीकी स्वामित्व की भावना
- चीनी संस्कृति, सक्रिय आर्थिक इंजन के साथ मिलकर अप्रत्याशित नतीजे पैदा करती है
- अनेक AI मॉडल किसी master plan का परिणाम नहीं, बल्कि कई टेक कंपनियों के व्यावहारिक और वर्तमान संतुलन को दर्शाते हैं
- उद्योग में ByteDance और Alibaba को ऐसे incumbents के रूप में सम्मान मिलता है जिनके पास विशाल संसाधन हैं और जो अधिकांश बाज़ारों में जीत सकते हैं
- DeepSeek एक सम्मानित तकनीकी नेता है, लेकिन market leader से दूर है; वह दिशा तय करता है, पर आर्थिक रूप से जीतने की संरचना उसके पास नहीं है
- Meituan (delivery service) या Ant Group जैसी कंपनियों का मॉडल बनाना पश्चिम में चौंकाने वाला लग सकता है, लेकिन उनका मानना है कि LLM भविष्य के तकनीकी उत्पादों का केंद्र है, इसलिए मजबूत foundation जरूरी है
- यदि कोई general model को fine-tune करे, तो open community feedback से stack मजबूत किया जा सकता है, और अपने उत्पादों के लिए internal fine-tuned versions भी बनाए रखे जा सकते हैं
- "open-first" सोच व्यावहारिकता पर आधारित है: मॉडल पर मजबूत feedback पाना, open source community में योगदान देना, और मिशन को मजबूत करना
-
4. सरकारी समर्थन वास्तविक है, लेकिन उसका पैमाना अस्पष्ट है
- अक्सर यह दावा किया जाता है कि चीनी सरकार open LLM प्रतिस्पर्धा का सक्रिय समर्थन कर रही है
- सरकार कई स्तरों पर विकेंद्रीकृत है, और हर स्तर पर वास्तव में क्या किया जा रहा है, इसका स्पष्ट playbook नहीं है
- बीजिंग के neighborhood, टेक कंपनियों के offices आकर्षित करने के लिए एक-दूसरे से प्रतिस्पर्धा करते हैं
- दी जाने वाली "मदद" में लगभग निश्चित रूप से permits जैसी नौकरशाही प्रक्रियाओं को सरल बनाना शामिल है, लेकिन यह talent आकर्षण या chip smuggling तक जाती है या नहीं, यह स्पष्ट नहीं
- यात्रा के दौरान सरकारी रुचि या मदद का उल्लेख कई बार हुआ, लेकिन ठोस रूप से रिपोर्ट करने लायक पर्याप्त विवरण नहीं थे
- इस बात का कोई संकेत नहीं था कि चीनी सरकार का शीर्ष स्तर मॉडलों के तकनीकी निर्णयों को प्रभावित करता है
-
5. डेटा उद्योग कहीं कम विकसित है
- यह सुनने को मिला था कि Anthropic या OpenAI, एक ही environment पर $10 million से अधिक, और सालाना सैकड़ों मिलियन डॉलर RL frontier scaling पर खर्च करते हैं; इसलिए यह जांचना चाहा गया कि चीनी लैब्स भी अमेरिकी कंपनियों से वही environments खरीदती हैं या घरेलू इकोसिस्टम उनका समर्थन करता है
- डेटा उद्योग पूरी तरह अनुपस्थित नहीं है, लेकिन गुणवत्ता अपेक्षाकृत कम है, इसलिए अक्सर environments या data को खुद बनाना बेहतर पड़ता है
- शोधकर्ता स्वयं RL training environments बनाने में काफी समय लगाते हैं
- ByteDance और Alibaba जैसी बड़ी कंपनियों के पास इसे समर्थन देने के लिए in-house data labeling teams हैं
- यह सब पिछले बिंदु की buy से अधिक build वाली सोच को दर्शाता है
-
6. Nvidia chips की तीव्र मांग
- Nvidia compute training का gold standard है, और सभी लैब्स इसकी कमी के कारण सीमित हैं
- यदि सप्लाई मिले, तो वे निश्चित रूप से खरीदेंगी
- Huawei सहित अन्य accelerators को inference के लिए सकारात्मक माना जाता है, और अनेक लैब्स को Huawei chips तक पहुंच है
- ये बिंदु एक बहुत अलग AI इकोसिस्टम की तस्वीर पेश करते हैं, जहां पश्चिमी लैब्स के संचालन तरीके को चीन पर जल्दी से मैप करने पर category error हो सकता है
- असली सवाल यह है कि क्या ये अलग इकोसिस्टम वास्तव में अलग प्रकार के मॉडल बनाएंगे, या फिर चीनी मॉडल हमेशा अमेरिकी frontier models के 3–9 महीने पुराने संस्करण के रूप में ही समझे जाएंगे
वैश्विक संतुलन
- चीन ऐसा स्थान नहीं है जिसे नियमों या किसी recipe में समेटा जा सके; वहां बहुत अलग dynamics और chemistry हैं
- उसकी संस्कृति बहुत पुरानी, गहरी और घरेलू तकनीकी निर्माण के तरीके के साथ पूरी तरह गुंथी हुई है
- अमेरिका की मौजूदा शक्ति-संरचना, चीन के बारे में अपने दृष्टिकोण को निर्णय-निर्माण के केंद्रीय उपकरण की तरह इस्तेमाल करती है, लेकिन चीन में ऐसे गुण और स्वाभाविक प्रवृत्तियां हैं जिन्हें पश्चिमी decision-making से मॉडल करना बहुत कठिन है
- जब इन लैब्स से सीधे पूछा जाता है कि वे अपने शीर्ष मॉडलों को open में क्यों जारी करते हैं, तब भी स्वामित्व भावना और वास्तविक इकोसिस्टम समर्थन का संगम आसानी से समझ में नहीं आता
- लगभग सभी प्रमुख चीनी टेक कंपनियां अपना general-purpose LLM बना रही हैं
- Meituan (delivery service), Xiaomi (व्यापक consumer tech company) आदि open-weight models जारी कर रही हैं
- अमेरिका की समकक्ष कंपनियां बस सेवाएं खरीद लेंगी
- ये कंपनियां LLM इसलिए नहीं बना रहीं कि यह hot trend है, बल्कि इसलिए कि वे अपने stack को नियंत्रित करना और इस युग की सबसे महत्वपूर्ण तकनीक विकसित करना चाहती हैं
- चीनी शोधकर्ताओं की इंसानियत, आकर्षण और सच्ची गर्मजोशी एक बेहद मानवीय अनुभव है
- अमेरिका में परिचित कठोर geopolitics वाली बातचीत उनमें बिल्कुल नहीं उतरी थी
- यदि open इकोसिस्टम वैश्विक स्तर पर फलता-फूलता है, तो अधिक सुरक्षित, सुलभ और उपयोगी AI बनाया जा सकता है; अभी सवाल यह है कि क्या अमेरिकी लैब्स उस leadership position को लेने के लिए कदम उठाएंगी
- open models को प्रभावित करने वाले executive order से जुड़ी अफवाहें और बढ़ रही हैं, जो अमेरिकी नेतृत्व और वैश्विक इकोसिस्टम के बीच तालमेल को और जटिल बना सकती हैं
3 टिप्पणियां
"चीन को इंजीनियर चलाते हैं" -> "चीन को कम्युनिस्ट पार्टी चलाती है"
कभी-कभी मुझे चिंता होती है कि क्या चीन के प्रति हमारी अत्यधिक और अविवेकपूर्ण आसक्ति
हमारे भीतर के राक्षस को पैदा नहीं कर रही है।
जैसे नाज़ियों के सत्ता में आने के औचित्यों में से एक साम्यवाद-विरोध भी था।
सिर्फ़ एक चीन...!