Claude Code के साथ RollerCoaster Tycoon खेलकर देखा
(labs.ramp.com)- Claude Code को ओपन सोर्स गेम RollerCoaster Tycoon 2(OpenRCT2) में इंटीग्रेट करके यह प्रयोग किया गया कि AI वास्तव में एक amusement park चला सके
- AI ने वित्त, मेहमानों की शिकायतें, राइड खराबी डेटा समेत 100 से अधिक metrics का विश्लेषण किया और drink stall लगाना, staff hire करना, entry fee समायोजित करना जैसी management decisions अपने-आप कीं
- CLI टूल rctctl के जरिए गेम के भीतर की हर action command line से की गई, और इसका design Kubernetes के kubectl जैसी structure पर आधारित है
- Claude ने data analysis, pricing adjustment, staff management में ताकत दिखाई, लेकिन path connection, roller coaster placement, terrain recognition जैसे spatial tasks में सीमाएँ सामने आईं
- इस प्रयोग से यह पुष्टि हुई कि agent design का मूल पर्यावरण की legibility और interface quality है
प्रोजेक्ट अवलोकन
- Ramp Labs ने Claude Code को RollerCoaster Tycoon 2 में इंटीग्रेट करके यह प्रयोग किया कि AI सीधे पार्क संचालन संभाल सके
- Claude ने गेम के भीतर वित्त, guest satisfaction, राइड की स्थिति आदि 100 से अधिक data points का विश्लेषण किया
- नतीजों के आधार पर drink stall जोड़ना, mechanic hire करना, entry fee बढ़ाना जैसी कार्रवाइयाँ अपने-आप सुझाईं
- इस प्रयोग का उद्देश्य B2B SaaS environment में AI agent design के lessons हासिल करना था
- RollerCoaster Tycoon को इसलिए चुना गया क्योंकि यह customer-centric business operation और digital feedback loop को दर्शाने वाला गेम है
RollerCoaster Tycoon ही क्यों
- Ramp इस समय task-wise छोटे agents विकसित कर रहा है और security व context limits को ध्यान में रखने वाला approach अपनाता है
- लेकिन व्यापक permissions वाले एक single agent पर प्रयोग करने की इच्छा भी थी
- RollerCoaster Tycoon एक ऐसा environment है जहाँ economy, customers, और operations management एक साथ जुड़े हैं, इसलिए यह SaaS operations जैसी structure देता है
- गेम का interface B2B SaaS dashboard जैसा है, और Claude के retro-futuristic terminal interface के साथ भी अच्छी तरह मेल खाता है
Claude की क्षमताएँ और सीमाएँ
- OpenRCT2 को fork करके उसमें terminal window जोड़ी गई, ताकि Claude command line से गेम को control कर सके
- rctctl CLI user के लिए उपलब्ध लगभग सभी actions को cover करता है और JSON-RPC के जरिए game state से communicate करता है
- Claude ने visual input की जगह ASCII map output से spatial information समझी
Claude की ताकत
- गेम ज्ञान: RCT से जुड़ा ज्ञान काफी मजबूत है और 90s के गेम environment में भी स्वाभाविक रूप से काम करता है
- जानकारी एकत्र करना: guest feedback, financial data जैसे विभिन्न metrics को एक साथ जोड़कर विश्लेषित करता है
- digital manipulation: राइड खोलना-बंद करना, कीमत बदलना, staff hire करना, marketing चलाना जैसे non-spatial tasks में मजबूत
- facility placement: toilet, drink stall जैसी simple structures को स्थिरता से place कर सकता है
Claude की कमजोरियाँ
- path connection: रास्ता बनाना, entrance-exit जोड़ना जैसे spatial tasks में कठिनाई
- roller coaster placement: बड़े rides install करते समय obstacles और terrain को पहचानने में विफल
- 3D spatial recognition: slope, underground structure, custom coaster design संभव नहीं
- निष्कर्षतः Claude information-based management में मजबूत है, लेकिन visual और spatial manipulation में कमजोर है
build प्रक्रिया
- OpenRCT2(C++) के आधार पर Claude terminal window, rctctl CLI, RPC layer, और test code जोड़े गए
- शुरुआती version की planning ChatGPT o3-Pro Deep Research से हुई, बाद में GPT-5.1-codex के साथ दोबारा implement किया गया
- कुल 40 घंटे से अधिक लगे, और feedback loop की कमी को सबसे बड़ा bottleneck बताया गया
- QA efficiency बढ़ाने के लिए Claude से सीधे repository में bug report लिखवाई गई
मुख्य सीख
- environment legibility: Claude साफ-सुथरे data interface पर बहुत अच्छा काम करता है, लेकिन text-based spatial representation में कमजोर है
- coding agent की value: नए model updates (Claude Opus 4.5 आदि) तुरंत reflect हुए, जिससे development speed बढ़ी
- development loop का महत्व: automated QA loop न हो तो productivity बहुत तेजी से गिरती है
- अनुभव का महत्व: LLM कैसे काम करता है, इसे समझने का सबसे अच्छा तरीका है सीधे प्रयोग करना और खुद खेलना
execution और open source जानकारी
- macOS(Sonoma या उससे ऊपर), Xcode, CMake, Ninja, और RCT2(licensed copy) की ज़रूरत है
rctctlCLI का kubectl-style command structure है, और Claude JSON-RPC के जरिए गेम को control करता है- build outputs:
- OpenRCT2 (terminal-embedded version)
- rctctl (CLI tool)
- Sprite assets
- पूरा code GitHub(jaysobel/OpenRCT2) पर उपलब्ध है, और Twitch पर live demo भी देखा जा सकता है
निष्कर्ष
- Claude Code ने operations automation की संभावनाएँ और सीमाएँ दोनों एक साथ दिखाईं
- RollerCoaster Tycoon ने graphic interface और intelligent systems के बीच एक transitional प्रयोगशाला की तरह काम किया
- मुख्य insight: AI agent की सफलता या विफलता पर्यावरण की स्पष्टता और interface design की quality पर निर्भर करती है
1 टिप्पणियां
Hacker News की राय
मुझे हमेशा यह खलता है कि मेरे LLM द्वारा इस्तेमाल किए जाने वाले tools का स्तर बहुत नीचे है
मैं IDE में एक क्लिक से refactoring, symbol tracing, function usages देख लेता हूँ, लेकिन LLM सिर्फ grep, diff, cat जैसे आदिम commands ही इस्तेमाल करता है
सोचता हूँ क्या LLM को बेहतर code writing·refactoring tools देने की कोई कोशिश हो रही है
AGENTS.md में साफ़ लिखने पर भी उसे नज़रअंदाज़ करके सरल तरीके पर लौट जाता है, जो काफ़ी निराशाजनक है
अगर JetBrains की refactoring·code inspection क्षमता को AI से जोड़ा गया होता, तो वह काफ़ी आगे होता
बल्कि LLM की ताकत low-level tools को जोड़कर समस्याएँ हल करने में है
इंसान के लिए जटिल 20-line Python script, LLM 0.5 सेकंड में बना देता है
यह code snippets को तेज़ी से समझकर जोड़ता है, इसलिए refactoring features उल्टा भ्रम पैदा कर सकते हैं
बहुत ज़्यादा tools देने पर निर्णय क्षमता धुंधली पड़ने का जोखिम है
मैं लेखक हूँ। bonus links साझा कर रहा हूँ
Simon Willison के claude-code-transcripts का इस्तेमाल करने वाला session script
Reddit post
OpenRCT2 project repo
Claude image-based input में मज़बूत है, लेकिन ASCII diagrams में कमज़ोर हो सकता है
वास्तविक दुनिया के agent design की तरह, general-purpose agents की सीमाएँ environment visibility और interface strength में होती हैं
इसलिए agents को ‘intelligence’ नहीं बल्कि ‘diligence’ को automate करने वाली चीज़ के रूप में देखना ज़्यादा सही है
“revert” शब्द का ग़लत इस्तेमाल होने से Codex ने सचमुच
git revertचला दिया और काम की सामग्री वापस पलट गईgit revertकोई destructive command नहीं है, इसलिए अगर data loss हुआ था, तो शायद वहgit reset --hardरहा होगाjj statusडाल दें तो यह सुरक्षित रहता हैयह चौंकाने वाली बात है कि यह game assembly code में सिर्फ़ एक व्यक्ति ने develop किया था
मैं उस developer को ढूँढकर धन्यवाद कहना चाहता हूँ
Claude Code की यह कोशिश भी प्रभावशाली लगी, इसलिए दिलचस्पी जगी
यह हिस्सा दिलचस्प था कि C++ बिल्कुल न जानते हुए भी vibe-coding से project पूरा कर लिया गया
आज की पीढ़ी शायद ऐसे environment की क़ीमत को ठीक से नहीं समझती
वीडियो के आख़िर का interview काफ़ी प्रभावशाली था
kubectl-style CLI, Claude का feedback, warning system जैसे AI और इंसान के collaboration tools लगातार ज़्यादा महत्वपूर्ण होते जा रहे हैं
अगर इंसान के लिए visually understandable context, AI को भी दिया जाए, तो नतीजे बहुत बेहतर हो सकते हैं
सिर्फ़ context बढ़ाने से learning नहीं होती, आख़िरकार fine-tuning की ज़रूरत पड़ती है
लेख दिलचस्प था, लेकिन AI ने वास्तव में game कितना अच्छा खेला, इस पर result analysis कम था
2D map को समझना मुश्किल था, इसलिए उसने बस toilet और hotdog stall जैसी चीज़ें ही बनाई
multimodal model होता तो शायद बहुत बेहतर करता
जिज्ञासा थी कि Claude Code में बचा हुआ context कैसे देखा जाता है
/contextcommand से तुरंत देखा जा सकता हैरंगीन bar के ज़रिए बची हुई क्षमता को visualise करने वाला plugin भी है
ऐसे experiments के लिए Civilization जैसे turn-based games ज़्यादा उपयुक्त लगते हैं
क्योंकि map grid structure में होता है, और progression turn-by-turn होती है