• Cursor ने घोषणा की कि उसने ‘autonomous coding agents’ के हफ्तों तक चलने वाले प्रयोग किए, ताकि यह जांचा जा सके कि क्या इंसानी टीमों को महीनों लगने वाले प्रोजेक्ट्स को automate किया जा सकता है
  • इस सिस्टम को सत्यापित करने के लिए ‘शुरू से एक web browser बनाना’ लक्ष्य रखा गया, और दावा किया गया कि agents ने लगभग एक हफ्ते में 10 लाख से अधिक lines of code लिखीं
  • लेकिन सार्वजनिक GitHub repository (fastrender) में कई compile errors और CI failures दिखते हैं, जिससे यह स्पष्ट होता है कि यह चलने योग्य browser नहीं है
  • Cursor ने यह काम करता है या नहीं, reproducible demo, या build होने वाला commit पेश नहीं किया, और प्रयोग की सफलता के ठोस सबूत भी नहीं दिए
  • इसके बावजूद Cursor ने “agents ने बड़े प्रोजेक्ट्स में meaningful progress हासिल की” जैसा वर्णन किया, जिससे वास्तविक performance verification के बिना सफलता का आभास मिलता है

Cursor के ब्लॉग प्रयोग का सार

  • 14 जनवरी 2026 को Cursor ने Scaling long-running autonomous coding शीर्षक से एक ब्लॉग post प्रकाशित की
    • लक्ष्य था यह समझना कि “इंसानी टीमों को महीनों लगने वाले प्रोजेक्ट्स को autonomous coding agents के साथ कितनी दूर तक scale किया जा सकता है”
  • कई approaches आज़माने के बाद, Cursor ने कहा कि वह ऐसे सिस्टम तक पहुंचा जो “coordination problem को हल कर सकता है और single agent के बिना बड़े प्रोजेक्ट्स तक scale कर सकता है”
  • सत्यापन के लिए ‘शुरू से web browser बनाने’ का प्रयोग किया गया, और कहा गया कि agents ने लगभग एक हफ्ते में 1,000 files में 10 लाख से अधिक lines of code लिखीं

प्रयोग के नतीजों की अस्पष्टता

  • Cursor ने दावा किया कि “नए agents ने codebase को समझा और meaningful progress हासिल की”, और “सैकड़ों workers ने एक ही branch पर एक साथ push किया”
    • लेकिन browser वास्तव में काम करता है या नहीं, यह स्पष्ट रूप से नहीं बताया गया
  • post में screenshot video शामिल है, लेकिन runnable demo या ठोस परिणामों का विवरण नहीं है
  • “शुरू से browser बनाना बहुत कठिन है” इस कथन के अलावा काम करने का कोई सबूत नहीं दिया गया

codebase सत्यापन के नतीजे

  • repository को सीधे build करने पर ‘fastrender’ library compile नहीं होती (34 errors, 94 warnings)
  • हाल की GitHub Actions runs में भी workflow errors और कई compile failures दिखाई देते हैं
    • हाल के 100 commits में एक भी commit सफलतापूर्वक build नहीं हुआ
  • code के अंदरूनी हिस्से को इरादे या संरचना के बिना ‘AI slop’ स्तर का output बताया गया
    • ऐसा लगता है कि cargo build या cargo check command तक नहीं चलाए गए
    • संबंधित issue #98 अभी भी खुला है

reproducibility और reliability की समस्या

  • Cursor के ब्लॉग में कैसे चलाना है, अपेक्षित परिणाम क्या हैं, और यह कैसे काम करता है — इसका कोई विवरण नहीं है
  • reproducible demo, build instructions, या verified commit(tag/release/commit) उपलब्ध नहीं कराए गए
  • इसके बावजूद लेख की संरचना और भाषा इसे “काम करने वाला prototype” जैसा दिखाती है
  • Cursor ने स्पष्ट रूप से “यह काम करता है” नहीं कहा, इसलिए यह झूठा बयान नहीं है, लेकिन यह सफलता का संकेत देने वाला impression छोड़ता है

निष्कर्ष और मूल्यांकन

  • Cursor ने इसे “production-level browser” नहीं कहा, लेकिन ‘meaningful progress’ और ‘browser बनाना’ जैसी अभिव्यक्तियों से इसे सफल प्रयोग जैसा दिखाया गया
  • लेकिन काम करने के सबूत, build होने वाला code, और reproducible results बिल्कुल नहीं हैं
  • “सैकड़ों agents ने मिलकर बड़े प्रोजेक्ट में प्रगति हासिल की” यह दावा बिना किसी सबूत का दावा है
    • यह न्यूनतम मानदंड “compile हो सके और एक साधारण HTML file render कर सके” तक भी पूरा नहीं करता
  • नतीजतन, Cursor का यह प्रयोग autonomous coding scaling की संभावना से अधिक, बड़े पैमाने पर code generation की सीमाओं को दिखाने वाला उदाहरण बनकर रह जाता है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.