Claude Code के साथ RollerCoaster Tycoon खेलकर देखा

(labs.ramp.com)

16 पॉइंट द्वारा GN⁺ 2026-01-19 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Claude Code को ओपन सोर्स गेम RollerCoaster Tycoon 2(OpenRCT2) में इंटीग्रेट करके यह प्रयोग किया गया कि AI वास्तव में एक amusement park चला सके
AI ने वित्त, मेहमानों की शिकायतें, राइड खराबी डेटा समेत 100 से अधिक metrics का विश्लेषण किया और drink stall लगाना, staff hire करना, entry fee समायोजित करना जैसी management decisions अपने-आप कीं
CLI टूल rctctl के जरिए गेम के भीतर की हर action command line से की गई, और इसका design Kubernetes के kubectl जैसी structure पर आधारित है
Claude ने data analysis, pricing adjustment, staff management में ताकत दिखाई, लेकिन path connection, roller coaster placement, terrain recognition जैसे spatial tasks में सीमाएँ सामने आईं
इस प्रयोग से यह पुष्टि हुई कि agent design का मूल पर्यावरण की legibility और interface quality है

प्रोजेक्ट अवलोकन

Ramp Labs ने Claude Code को RollerCoaster Tycoon 2 में इंटीग्रेट करके यह प्रयोग किया कि AI सीधे पार्क संचालन संभाल सके
- Claude ने गेम के भीतर वित्त, guest satisfaction, राइड की स्थिति आदि 100 से अधिक data points का विश्लेषण किया
- नतीजों के आधार पर drink stall जोड़ना, mechanic hire करना, entry fee बढ़ाना जैसी कार्रवाइयाँ अपने-आप सुझाईं
इस प्रयोग का उद्देश्य B2B SaaS environment में AI agent design के lessons हासिल करना था
RollerCoaster Tycoon को इसलिए चुना गया क्योंकि यह customer-centric business operation और digital feedback loop को दर्शाने वाला गेम है

RollerCoaster Tycoon ही क्यों

Ramp इस समय task-wise छोटे agents विकसित कर रहा है और security व context limits को ध्यान में रखने वाला approach अपनाता है
लेकिन व्यापक permissions वाले एक single agent पर प्रयोग करने की इच्छा भी थी
RollerCoaster Tycoon एक ऐसा environment है जहाँ economy, customers, और operations management एक साथ जुड़े हैं, इसलिए यह SaaS operations जैसी structure देता है
गेम का interface B2B SaaS dashboard जैसा है, और Claude के retro-futuristic terminal interface के साथ भी अच्छी तरह मेल खाता है

Claude की क्षमताएँ और सीमाएँ

OpenRCT2 को fork करके उसमें terminal window जोड़ी गई, ताकि Claude command line से गेम को control कर सके
rctctl CLI user के लिए उपलब्ध लगभग सभी actions को cover करता है और JSON-RPC के जरिए game state से communicate करता है
Claude ने visual input की जगह ASCII map output से spatial information समझी

Claude की ताकत

गेम ज्ञान: RCT से जुड़ा ज्ञान काफी मजबूत है और 90s के गेम environment में भी स्वाभाविक रूप से काम करता है
जानकारी एकत्र करना: guest feedback, financial data जैसे विभिन्न metrics को एक साथ जोड़कर विश्लेषित करता है
digital manipulation: राइड खोलना-बंद करना, कीमत बदलना, staff hire करना, marketing चलाना जैसे non-spatial tasks में मजबूत
facility placement: toilet, drink stall जैसी simple structures को स्थिरता से place कर सकता है

Claude की कमजोरियाँ

path connection: रास्ता बनाना, entrance-exit जोड़ना जैसे spatial tasks में कठिनाई
roller coaster placement: बड़े rides install करते समय obstacles और terrain को पहचानने में विफल
3D spatial recognition: slope, underground structure, custom coaster design संभव नहीं
निष्कर्षतः Claude information-based management में मजबूत है, लेकिन visual और spatial manipulation में कमजोर है

build प्रक्रिया

OpenRCT2(C++) के आधार पर Claude terminal window, rctctl CLI, RPC layer, और test code जोड़े गए
शुरुआती version की planning ChatGPT o3-Pro Deep Research से हुई, बाद में GPT-5.1-codex के साथ दोबारा implement किया गया
कुल 40 घंटे से अधिक लगे, और feedback loop की कमी को सबसे बड़ा bottleneck बताया गया
QA efficiency बढ़ाने के लिए Claude से सीधे repository में bug report लिखवाई गई

मुख्य सीख

environment legibility: Claude साफ-सुथरे data interface पर बहुत अच्छा काम करता है, लेकिन text-based spatial representation में कमजोर है
coding agent की value: नए model updates (Claude Opus 4.5 आदि) तुरंत reflect हुए, जिससे development speed बढ़ी
development loop का महत्व: automated QA loop न हो तो productivity बहुत तेजी से गिरती है
अनुभव का महत्व: LLM कैसे काम करता है, इसे समझने का सबसे अच्छा तरीका है सीधे प्रयोग करना और खुद खेलना

execution और open source जानकारी

macOS(Sonoma या उससे ऊपर), Xcode, CMake, Ninja, और RCT2(licensed copy) की ज़रूरत है
rctctl CLI का kubectl-style command structure है, और Claude JSON-RPC के जरिए गेम को control करता है
build outputs:
- OpenRCT2 (terminal-embedded version)
- rctctl (CLI tool)
- Sprite assets
पूरा code GitHub(jaysobel/OpenRCT2) पर उपलब्ध है, और Twitch पर live demo भी देखा जा सकता है

निष्कर्ष

Claude Code ने operations automation की संभावनाएँ और सीमाएँ दोनों एक साथ दिखाईं
RollerCoaster Tycoon ने graphic interface और intelligent systems के बीच एक transitional प्रयोगशाला की तरह काम किया
मुख्य insight: AI agent की सफलता या विफलता पर्यावरण की स्पष्टता और interface design की quality पर निर्भर करती है

1 टिप्पणियां

GN⁺ 2026-01-19

Hacker News की राय

मुझे हमेशा यह खलता है कि मेरे LLM द्वारा इस्तेमाल किए जाने वाले tools का स्तर बहुत नीचे है
मैं IDE में एक क्लिक से refactoring, symbol tracing, function usages देख लेता हूँ, लेकिन LLM सिर्फ grep, diff, cat जैसे आदिम commands ही इस्तेमाल करता है
सोचता हूँ क्या LLM को बेहतर code writing·refactoring tools देने की कोई कोशिश हो रही है
- VSCode Diagnostics या LSP server का access देने पर भी, LLM हमेशा बेसिक CLI tools ही इस्तेमाल करना चाहता है
  AGENTS.md में साफ़ लिखने पर भी उसे नज़रअंदाज़ करके सरल तरीके पर लौट जाता है, जो काफ़ी निराशाजनक है
- यह देखकर हैरानी होती है कि ज़्यादातर AI development tools VSCode-आधारित हैं
  अगर JetBrains की refactoring·code inspection क्षमता को AI से जोड़ा गया होता, तो वह काफ़ी आगे होता
- Claude Code ने दिसंबर 2025 संस्करण में LSP को आधिकारिक support दिया, लेकिन फिर भी लगता है कि इसे अब भी सरल tools-केंद्रित ढंग से train किया गया है
  बल्कि LLM की ताकत low-level tools को जोड़कर समस्याएँ हल करने में है
  इंसान के लिए जटिल 20-line Python script, LLM 0.5 सेकंड में बना देता है
- Zed Editor, LSP-आधारित features सीधे LLM को देता है, जिससे grep पर निर्भरता कम होती है
- LLM को इंसानों की तरह IDE features की ज़रूरत ज़रूरी नहीं है
  यह code snippets को तेज़ी से समझकर जोड़ता है, इसलिए refactoring features उल्टा भ्रम पैदा कर सकते हैं
  बहुत ज़्यादा tools देने पर निर्णय क्षमता धुंधली पड़ने का जोखिम है
मैं लेखक हूँ। bonus links साझा कर रहा हूँ
Simon Willison के claude-code-transcripts का इस्तेमाल करने वाला session script
Reddit post
OpenRCT2 project repo
- जिज्ञासा है कि क्या CLI की जगह screenshots या visualized screens से evaluation किया गया था
  Claude image-based input में मज़बूत है, लेकिन ASCII diagrams में कमज़ोर हो सकता है
- Claude की visual·spatial recognition limits का ज़िक्र करते हुए, कुछ लोगों का मानना है कि image understanding में OpenAI models बेहतर हो सकते हैं
वास्तविक दुनिया के agent design की तरह, general-purpose agents की सीमाएँ environment visibility और interface strength में होती हैं
इसलिए agents को ‘intelligence’ नहीं बल्कि ‘diligence’ को automate करने वाली चीज़ के रूप में देखना ज़्यादा सही है
“revert” शब्द का ग़लत इस्तेमाल होने से Codex ने सचमुच git revert चला दिया और काम की सामग्री वापस पलट गई
- यह हैरानी की बात है कि ऐसे tools work logs को replay करने लायक़ तरीके से save नहीं करते
  git revert कोई destructive command नहीं है, इसलिए अगर data loss हुआ था, तो शायद वह git reset --hard रहा होगा
- ऐसे हादसे रोकने के लिए command permission control feature की ज़रूरत है
- इसलिए कुछ लोग Jujutsu इस्तेमाल करने की बात भी करते हैं; prompt में jj status डाल दें तो यह सुरक्षित रहता है
यह चौंकाने वाली बात है कि यह game assembly code में सिर्फ़ एक व्यक्ति ने develop किया था
मैं उस developer को ढूँढकर धन्यवाद कहना चाहता हूँ
Claude Code की यह कोशिश भी प्रभावशाली लगी, इसलिए दिलचस्पी जगी
यह हिस्सा दिलचस्प था कि C++ बिल्कुल न जानते हुए भी vibe-coding से project पूरा कर लिया गया
- आम तौर पर vibe-coding की बात में “कुछ घंटों में ख़त्म कर दिया” जैसा दावा होता है, लेकिन इस बार एक realistic timeline देना ताज़गी भरा लगा
- उनका trial and error और problem-solving process वाकई बहुत दिलचस्प था
- अगर 1997 में ऐसा कुछ होता, तो शायद मैं अपनी पूरी जमा-पूँजी लगाकर भी इसे ख़रीद लेता
  आज की पीढ़ी शायद ऐसे environment की क़ीमत को ठीक से नहीं समझती
वीडियो के आख़िर का interview काफ़ी प्रभावशाली था
kubectl-style CLI, Claude का feedback, warning system जैसे AI और इंसान के collaboration tools लगातार ज़्यादा महत्वपूर्ण होते जा रहे हैं
अगर इंसान के लिए visually understandable context, AI को भी दिया जाए, तो नतीजे बहुत बेहतर हो सकते हैं
- लेकिन AI का खुद को improve करने वाला ढाँचा व्यवहार में उतना अच्छा काम नहीं करता
  सिर्फ़ context बढ़ाने से learning नहीं होती, आख़िरकार fine-tuning की ज़रूरत पड़ती है
लेख दिलचस्प था, लेकिन AI ने वास्तव में game कितना अच्छा खेला, इस पर result analysis कम था
- असल में वह financial management में अच्छा था, लेकिन building construction में कमज़ोर था
  2D map को समझना मुश्किल था, इसलिए उसने बस toilet और hotdog stall जैसी चीज़ें ही बनाई
  multimodal model होता तो शायद बहुत बेहतर करता
- कुछ लोगों का मानना है कि AI का मूल generation capability है, validation नहीं
जिज्ञासा थी कि Claude Code में बचा हुआ context कैसे देखा जाता है
- /context command से तुरंत देखा जा सकता है
- status line में context usage indicator भी जोड़ा जा सकता है
  रंगीन bar के ज़रिए बची हुई क्षमता को visualise करने वाला plugin भी है
ऐसे experiments के लिए Civilization जैसे turn-based games ज़्यादा उपयुक्त लगते हैं
क्योंकि map grid structure में होता है, और progression turn-by-turn होती है

Claude Code के साथ RollerCoaster Tycoon खेलकर देखा

प्रोजेक्ट अवलोकन

RollerCoaster Tycoon ही क्यों

Claude की क्षमताएँ और सीमाएँ

Claude की ताकत

Claude की कमजोरियाँ

build प्रक्रिया

मुख्य सीख

execution और open source जानकारी

निष्कर्ष

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News की राय