AI गेम स्टूडियो बनाना: हमने क्या सीखा

xguru · 2024-06-17T11:14:01+09:00

Braindump, LLM और generative AI की नई दुनिया में गेम बनाना कैसा दिख सकता है, इसकी कल्पना करने की एक कोशिश है Braindump का उपयोग करके सिर्फ prompts लिखकर top-down/2.5D गेम या interactive worlds बनाए जा सकते हैं उदाहरण के लिए, अगर आप लिखें "ऐसा starfighter बनाओ जो lasers चला सके और BB-8 bombs गिरा सके", तो उसके लिए 3D models, game data और scripts तैयार हो जाते हैं शुरुआती प्रयोग से अब तक लगभग 6 महीने पहले एक साधारण prototype से शुरुआत हुई, फिर 3D model generation, multiplayer features, और UX में कई सुधार जोड़े गए अब Braindump में ये core features हैं units, abilities और attributes को define करना, जैसे: "50 HP वाला orc जो magic wand गिराता है" game map पर objects रखना, जैसे: "20 orcs को गोल घेरा बनाकर रखो" game rules और logic बनाना, जैसे: "जब orc की health 0 हो जाए, तो उसी जगह ghost orc spawn हो" नए 3D models बनाना, जैसे: "orc को pink बना दो और उसके fluffy ears कर दो", Meshy का उपयोग करके यह सब एक integrated natural-language prompt interface के जरिए उपलब्ध है चुनौती 1: prompting के लिए UX design LLM का उपयोग करके कुछ बनाते समय दो बड़ी समस्याएँ होती हैं LLM से लगातार मनचाहा परिणाम कैसे लिया जाए LLM के साथ interact करने के लिए सबसे अच्छा UX क्या हो कई prompt experiments के बाद, टीम ने मौजूदा iterative approach अपनाई पूरे गेम को एक ही बार में पूरे विवरण से generate करना अच्छा काम नहीं करता कई prompts के जरिए गेम को धीरे-धीरे बनाने से अधिक विस्तार देने और दोहराने का मौका मिलता है prompts और पारंपरिक controls के बीच सही संतुलन खोजने के लिए प्रयोग अभी भी जारी हैं चुनौती 2: LLM के लिए game API design मौजूदा game engines के लिए code generation में कठिनाइयाँ थीं LLM code snippets बनाने में अच्छे हैं, लेकिन बड़े software components और software architecture को बनाना और बनाए रखना उनके लिए कठिन है इसके बजाय TypeScript में एक बहुत simplified "game API" बनाया गया, ताकि LLM जितना संभव हो उतना structure पाकर code और data लिखने पर ध्यान दे सके API से generate हुई type definitions (.d.ts) को GPT को system prompt के रूप में देने पर, GPT अधिकतर पहली कोशिश में ही API का सही और consistent उपयोग करता है type checking का एक चौंकाने वाला फायदा भी मिला: GPT जब errors पकड़ता है, तो अक्सर खुद ही उन्हें ठीक करने की कोशिश करता है generated macros game API ने एक और दिलचस्प UX flow खोला: generated macros आम तौर पर application में macro एक छोटा program होता है जो tasks को automate कर सकता है Braindump system में हर prompt code generate करता है, और वह code game API में आने वाली लगभग हर चीज़ को automate कर सकता है उदाहरण के लिए, आप "campfire के पास tent रखो" जैसा prompt लिख सकते हैं उबाऊ काम भी automate किए जा सकते हैं, जैसे: "अलग-अलग stats वाली 5 अलग cats बनाओ" calculation वाले सवालों के जवाब भी मांगे जा सकते हैं, जैसे: "उत्तर की ओर मुख किए हुए tents कितने हैं?" इससे काम करने का एक नया तरीका खुलता है शुरुआत में यह थोड़ा अजीब लगता है, लेकिन आदत पड़ने पर बहुत उबाऊ काम कुछ ही सेकंड में रचनात्मक तरीके से पूरे हो जाते हैं AI और collaborative editing उद्देश्य था कि Braindump की हर चीज़ multiplayer हो इसमें game creation और gameplay दोनों शामिल हैं शुरुआत में सिर्फ एक बड़ा chat था, जिसमें हर कोई योगदान दे सकता था, लेकिन इससे भ्रम पैदा होता था मुख्य समस्या यह थी कि लोग अक्सर दो अलग और असंबंधित चीज़ों पर काम कर रहे होते थे कई solutions आज़माने के बाद टीम "Threads" नाम की पद्धति पर पहुँची दुनिया में कहीं से भी prompt शुरू किया जा सकता है, और जरूरत पड़ने पर उसी prompt को और specific बनाया या उसमें जोड़ किया जा सकता है thread को शुरुआत में latest game state दी जाती है, लेकिन project की पूरी history नहीं कई threads एक साथ "run" हो सकते हैं, लेकिन हर thread में एक समय में सिर्फ एक prompt चल सकता है अब तक यह काफी अच्छी तरह काम कर रहा है tests में 5 लोगों ने एक ही world पर साथ काम किया; थोड़ी अव्यवस्था जरूर थी, लेकिन यह फिर भी functional रहा users बेहतर तरीके से coordinate कर सकें, इसके लिए सक्रिय रूप से तरीकों की खोज की जा रही है benchmarking और testing prompt engine की performance जाँचने के लिए benchmarking tool बनाया गया यह tool दर्जनों scenarios चलाता है, जिनमें हर एक का अपना unique prompt होता है, और फिर GPT का उपयोग करके यह आकलन करता है कि prompt सफल रहा या नहीं एक दूसरे GPT को, जिसे "evaluator" कहा गया है और जिसका अपना system prompt है, ये conditions, completion के समय की simulated state, और आई हुई सभी errors दी जाती हैं; फिर उससे पूछा जाता है कि test सफल था या नहीं test suite अभी शुरुआती चरण में है, लेकिन जैसे-जैसे नए prompt styles और failure cases मिल रहे हैं, वैसे-वैसे अधिक tests जोड़े जा रहे हैं Braindump क्यों बना रहे हैं व्यक्तिगत रूप से, उन्हें हमेशा games और creativity से प्यार रहा है generative AI, productivity बढ़ाने का स्वाभाविक अगला चरण है इसके जरिए लोग बस और अधिक काम कर सकते हैं जब बड़े studios लगातार अधिक conservative games बना रहे हैं, तब छोटे groups या यहाँ तक कि अकेले व्यक्तियों को अपने dream game बनाने में सक्षम करना खुशी की बात है वे देखना चाहते हैं कि जब लोगों की उंगलियों पर पूरा AI game studio होगा, तो वे कौन-कौन से पागलपन भरे ideas सोचेंगे और उन्हें कैसे सच करेंगे आगे की योजना Braindump अभी बस शुरुआत में है अभी यह "commands" चलाने में काफी अच्छा है, जैसे: "cat बनाओ", लेकिन यह भी स्पष्ट है कि इसे और अधिक अस्पष्ट या "बड़े" tasks सँभालने लायक बढ़ाया जा सकता है फिलहाल इन बातों पर शोध हो रहा है Planning के जरिए "बड़े" prompts का समर्थन GPT को अनुमान लगाना बंद कराकर, उसकी जगह user से clarification माँगने के लिए प्रेरित करना GPT से अपने काम की आलोचना करवाकर code quality सुधारना discoverability और inspiration बेहतर करना, जैसे: "मैं इससे क्या बना सकता हूँ?" game engine features को ऐसे रूप में सुधारना जो LLM के लिए उपयुक्त हो

(braindump.me)

22 पॉइंट द्वारा xguru 2024-06-17 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

Braindump, LLM और generative AI की नई दुनिया में गेम बनाना कैसा दिख सकता है, इसकी कल्पना करने की एक कोशिश है
Braindump का उपयोग करके सिर्फ prompts लिखकर top-down/2.5D गेम या interactive worlds बनाए जा सकते हैं
- उदाहरण के लिए, अगर आप लिखें "ऐसा starfighter बनाओ जो lasers चला सके और BB-8 bombs गिरा सके", तो उसके लिए 3D models, game data और scripts तैयार हो जाते हैं

शुरुआती प्रयोग से अब तक

लगभग 6 महीने पहले एक साधारण prototype से शुरुआत हुई, फिर 3D model generation, multiplayer features, और UX में कई सुधार जोड़े गए
अब Braindump में ये core features हैं
- units, abilities और attributes को define करना, जैसे: "50 HP वाला orc जो magic wand गिराता है"
- game map पर objects रखना, जैसे: "20 orcs को गोल घेरा बनाकर रखो"
- game rules और logic बनाना, जैसे: "जब orc की health 0 हो जाए, तो उसी जगह ghost orc spawn हो"
- नए 3D models बनाना, जैसे: "orc को pink बना दो और उसके fluffy ears कर दो", Meshy का उपयोग करके
यह सब एक integrated natural-language prompt interface के जरिए उपलब्ध है

चुनौती 1: prompting के लिए UX design

LLM का उपयोग करके कुछ बनाते समय दो बड़ी समस्याएँ होती हैं
1. LLM से लगातार मनचाहा परिणाम कैसे लिया जाए
2. LLM के साथ interact करने के लिए सबसे अच्छा UX क्या हो
कई prompt experiments के बाद, टीम ने मौजूदा iterative approach अपनाई
- पूरे गेम को एक ही बार में पूरे विवरण से generate करना अच्छा काम नहीं करता
- कई prompts के जरिए गेम को धीरे-धीरे बनाने से अधिक विस्तार देने और दोहराने का मौका मिलता है
prompts और पारंपरिक controls के बीच सही संतुलन खोजने के लिए प्रयोग अभी भी जारी हैं

चुनौती 2: LLM के लिए game API design

मौजूदा game engines के लिए code generation में कठिनाइयाँ थीं
- LLM code snippets बनाने में अच्छे हैं, लेकिन बड़े software components और software architecture को बनाना और बनाए रखना उनके लिए कठिन है
इसके बजाय TypeScript में एक बहुत simplified "game API" बनाया गया, ताकि LLM जितना संभव हो उतना structure पाकर code और data लिखने पर ध्यान दे सके
API से generate हुई type definitions (.d.ts) को GPT को system prompt के रूप में देने पर, GPT अधिकतर पहली कोशिश में ही API का सही और consistent उपयोग करता है
type checking का एक चौंकाने वाला फायदा भी मिला: GPT जब errors पकड़ता है, तो अक्सर खुद ही उन्हें ठीक करने की कोशिश करता है

generated macros

game API ने एक और दिलचस्प UX flow खोला: generated macros
आम तौर पर application में macro एक छोटा program होता है जो tasks को automate कर सकता है
Braindump system में हर prompt code generate करता है, और वह code game API में आने वाली लगभग हर चीज़ को automate कर सकता है
- उदाहरण के लिए, आप "campfire के पास tent रखो" जैसा prompt लिख सकते हैं
- उबाऊ काम भी automate किए जा सकते हैं, जैसे: "अलग-अलग stats वाली 5 अलग cats बनाओ"
- calculation वाले सवालों के जवाब भी मांगे जा सकते हैं, जैसे: "उत्तर की ओर मुख किए हुए tents कितने हैं?"
इससे काम करने का एक नया तरीका खुलता है
- शुरुआत में यह थोड़ा अजीब लगता है, लेकिन आदत पड़ने पर बहुत उबाऊ काम कुछ ही सेकंड में रचनात्मक तरीके से पूरे हो जाते हैं

AI और collaborative editing

उद्देश्य था कि Braindump की हर चीज़ multiplayer हो
- इसमें game creation और gameplay दोनों शामिल हैं
शुरुआत में सिर्फ एक बड़ा chat था, जिसमें हर कोई योगदान दे सकता था, लेकिन इससे भ्रम पैदा होता था
- मुख्य समस्या यह थी कि लोग अक्सर दो अलग और असंबंधित चीज़ों पर काम कर रहे होते थे
कई solutions आज़माने के बाद टीम "Threads" नाम की पद्धति पर पहुँची
- दुनिया में कहीं से भी prompt शुरू किया जा सकता है, और जरूरत पड़ने पर उसी prompt को और specific बनाया या उसमें जोड़ किया जा सकता है
- thread को शुरुआत में latest game state दी जाती है, लेकिन project की पूरी history नहीं
- कई threads एक साथ "run" हो सकते हैं, लेकिन हर thread में एक समय में सिर्फ एक prompt चल सकता है
अब तक यह काफी अच्छी तरह काम कर रहा है
- tests में 5 लोगों ने एक ही world पर साथ काम किया; थोड़ी अव्यवस्था जरूर थी, लेकिन यह फिर भी functional रहा
- users बेहतर तरीके से coordinate कर सकें, इसके लिए सक्रिय रूप से तरीकों की खोज की जा रही है

benchmarking और testing

prompt engine की performance जाँचने के लिए benchmarking tool बनाया गया
- यह tool दर्जनों scenarios चलाता है, जिनमें हर एक का अपना unique prompt होता है, और फिर GPT का उपयोग करके यह आकलन करता है कि prompt सफल रहा या नहीं
एक दूसरे GPT को, जिसे "evaluator" कहा गया है और जिसका अपना system prompt है, ये conditions, completion के समय की simulated state, और आई हुई सभी errors दी जाती हैं; फिर उससे पूछा जाता है कि test सफल था या नहीं
test suite अभी शुरुआती चरण में है, लेकिन जैसे-जैसे नए prompt styles और failure cases मिल रहे हैं, वैसे-वैसे अधिक tests जोड़े जा रहे हैं

Braindump क्यों बना रहे हैं

व्यक्तिगत रूप से, उन्हें हमेशा games और creativity से प्यार रहा है
generative AI, productivity बढ़ाने का स्वाभाविक अगला चरण है
- इसके जरिए लोग बस और अधिक काम कर सकते हैं
जब बड़े studios लगातार अधिक conservative games बना रहे हैं, तब छोटे groups या यहाँ तक कि अकेले व्यक्तियों को अपने dream game बनाने में सक्षम करना खुशी की बात है
वे देखना चाहते हैं कि जब लोगों की उंगलियों पर पूरा AI game studio होगा, तो वे कौन-कौन से पागलपन भरे ideas सोचेंगे और उन्हें कैसे सच करेंगे

आगे की योजना

Braindump अभी बस शुरुआत में है
अभी यह "commands" चलाने में काफी अच्छा है, जैसे: "cat बनाओ", लेकिन यह भी स्पष्ट है कि इसे और अधिक अस्पष्ट या "बड़े" tasks सँभालने लायक बढ़ाया जा सकता है
फिलहाल इन बातों पर शोध हो रहा है
- Planning के जरिए "बड़े" prompts का समर्थन
- GPT को अनुमान लगाना बंद कराकर, उसकी जगह user से clarification माँगने के लिए प्रेरित करना
- GPT से अपने काम की आलोचना करवाकर code quality सुधारना
- discoverability और inspiration बेहतर करना, जैसे: "मैं इससे क्या बना सकता हूँ?"
- game engine features को ऐसे रूप में सुधारना जो LLM के लिए उपयुक्त हो