Elon Musk: Cursor अधिग्रहण समझौते के बाद "Cursor डेटा से Grok V9 का supplemental training करेंगे"
(x.com/elonmusk)- Elon Musk ने 15~17 मई को X (Twitter) पर सीधे Grok के नए मॉडल की training प्रगति साझा की
- मौजूदा public version (v4.3) 0.5T parameter वाले V8 foundation model पर आधारित है, और हर कुछ दिनों में इसमें सुधार किया जा रहा है
- अंदरूनी तौर पर विकसित हो रहा V9 1.5T parameter का है, और Musk ने कहा कि इसका "training अभी-अभी पूरा हुआ है"
- Musk ने कहा कि इस चरण को आमतौर पर "pre-training" कहा जाता है, लेकिन यह "गलत terminology" है
- V8 की तुलना में data curation, training recipe, और model scale—तीनों में बड़ा upgrade किया गया है
- Hopper पर trained V8 के विपरीत, V9 को Blackwell architecture के लिए optimize किया गया है
- अगले चरण में supplemental training जोड़ी जाएगी, जिसे आमतौर पर "mid-training" कहा जाता है, और इसमें Cursor डेटा शामिल किया जाएगा
- Musk ने यह भी कहा कि "V9, Cursor डेटा जोड़ने से पहले भी, पहले से ही बहुत शानदार performance दिखा रहा है"
▍पृष्ठभूमि: SpaceX-Cursor deal
- अप्रैल 2026 में, SpaceX (जिसका पिछले साल फरवरी में xAI के साथ merger हुआ था) ने Cursor को इसी साल के भीतर 60 अरब डॉलर में acquire करने का अधिकार, या collaboration के बदले 10 अरब डॉलर भुगतान करने वाला option contract किया
- इस contract से ठीक पहले, Cursor के senior engineer Andrew Milich और Jason Ginsberg xAI में चले गए और ऐसी संरचना में जुड़े कि वे सीधे Musk को report करें
- xAI के Colossus supercomputer (H100 10 लाख GPUs के बराबर compute) और Cursor के developer product/distribution network को जोड़ने वाली तस्वीर बन रही है
- Cursor पहले अपने model (Composer) की training के लिए xAI के हजारों chips किराये पर लेकर इस्तेमाल कर रहा था, और यह व्यवस्था अब इस contract के साथ औपचारिक हो गई है
- यानी, इस बार Grok V9 के लिए "Cursor डेटा supplemental training" वाला बयान सिर्फ साधारण collaboration नहीं, बल्कि यह संकेत है कि acquisition option contract से बनने वाली data synergy अब वास्तविक model training pipeline में प्रवेश करने लगी है
▍पढ़ने लायक बिंदु
- यह दिलचस्प है कि Musk ने industry standard term "pre-training" को सार्वजनिक रूप से नकारा और "supplemental training" / "mid-training" जैसे चरणों के भेद पर जोर दिया
- Cursor के पास सिर्फ code नहीं, बल्कि लाखों developers के real-time editing behavior, test results, logs, screenshots जैसी "coding behavior data" है — और coding agent training के लिए यह सबसे महंगी assets में से एक है
- Anthropic Claude और OpenAI Codex के coding market पर हावी रहने की स्थिति में, इसे xAI के लिए gap भरने की सबसे सीधी चाल के रूप में देखा जा रहा है
स्रोत:
- https://x.com/elonmusk (May 15, May 17 reply)
- https://cnbc.com/2026/04/…
- https://techcrunch.com/2026/04/…
अभी कोई टिप्पणी नहीं है.