- Braindump, LLM और generative AI की नई दुनिया में गेम बनाना कैसा दिख सकता है, इसकी कल्पना करने की एक कोशिश है
- Braindump का उपयोग करके सिर्फ prompts लिखकर top-down/2.5D गेम या interactive worlds बनाए जा सकते हैं
- उदाहरण के लिए, अगर आप लिखें "ऐसा starfighter बनाओ जो lasers चला सके और BB-8 bombs गिरा सके", तो उसके लिए 3D models, game data और scripts तैयार हो जाते हैं
शुरुआती प्रयोग से अब तक
- लगभग 6 महीने पहले एक साधारण prototype से शुरुआत हुई, फिर 3D model generation, multiplayer features, और UX में कई सुधार जोड़े गए
- अब Braindump में ये core features हैं
- units, abilities और attributes को define करना, जैसे: "50 HP वाला orc जो magic wand गिराता है"
- game map पर objects रखना, जैसे: "20 orcs को गोल घेरा बनाकर रखो"
- game rules और logic बनाना, जैसे: "जब orc की health 0 हो जाए, तो उसी जगह ghost orc spawn हो"
- नए 3D models बनाना, जैसे: "orc को pink बना दो और उसके fluffy ears कर दो", Meshy का उपयोग करके
- यह सब एक integrated natural-language prompt interface के जरिए उपलब्ध है
चुनौती 1: prompting के लिए UX design
- LLM का उपयोग करके कुछ बनाते समय दो बड़ी समस्याएँ होती हैं
- LLM से लगातार मनचाहा परिणाम कैसे लिया जाए
- LLM के साथ interact करने के लिए सबसे अच्छा UX क्या हो
- कई prompt experiments के बाद, टीम ने मौजूदा iterative approach अपनाई
- पूरे गेम को एक ही बार में पूरे विवरण से generate करना अच्छा काम नहीं करता
- कई prompts के जरिए गेम को धीरे-धीरे बनाने से अधिक विस्तार देने और दोहराने का मौका मिलता है
- prompts और पारंपरिक controls के बीच सही संतुलन खोजने के लिए प्रयोग अभी भी जारी हैं
चुनौती 2: LLM के लिए game API design
- मौजूदा game engines के लिए code generation में कठिनाइयाँ थीं
- LLM code snippets बनाने में अच्छे हैं, लेकिन बड़े software components और software architecture को बनाना और बनाए रखना उनके लिए कठिन है
- इसके बजाय TypeScript में एक बहुत simplified "game API" बनाया गया, ताकि LLM जितना संभव हो उतना structure पाकर code और data लिखने पर ध्यान दे सके
- API से generate हुई type definitions (
.d.ts) को GPT को system prompt के रूप में देने पर, GPT अधिकतर पहली कोशिश में ही API का सही और consistent उपयोग करता है
- type checking का एक चौंकाने वाला फायदा भी मिला: GPT जब errors पकड़ता है, तो अक्सर खुद ही उन्हें ठीक करने की कोशिश करता है
generated macros
- game API ने एक और दिलचस्प UX flow खोला: generated macros
- आम तौर पर application में macro एक छोटा program होता है जो tasks को automate कर सकता है
- Braindump system में हर prompt code generate करता है, और वह code game API में आने वाली लगभग हर चीज़ को automate कर सकता है
- उदाहरण के लिए, आप "campfire के पास tent रखो" जैसा prompt लिख सकते हैं
- उबाऊ काम भी automate किए जा सकते हैं, जैसे: "अलग-अलग stats वाली 5 अलग cats बनाओ"
- calculation वाले सवालों के जवाब भी मांगे जा सकते हैं, जैसे: "उत्तर की ओर मुख किए हुए tents कितने हैं?"
- इससे काम करने का एक नया तरीका खुलता है
- शुरुआत में यह थोड़ा अजीब लगता है, लेकिन आदत पड़ने पर बहुत उबाऊ काम कुछ ही सेकंड में रचनात्मक तरीके से पूरे हो जाते हैं
AI और collaborative editing
- उद्देश्य था कि Braindump की हर चीज़ multiplayer हो
- इसमें game creation और gameplay दोनों शामिल हैं
- शुरुआत में सिर्फ एक बड़ा chat था, जिसमें हर कोई योगदान दे सकता था, लेकिन इससे भ्रम पैदा होता था
- मुख्य समस्या यह थी कि लोग अक्सर दो अलग और असंबंधित चीज़ों पर काम कर रहे होते थे
- कई solutions आज़माने के बाद टीम "Threads" नाम की पद्धति पर पहुँची
- दुनिया में कहीं से भी prompt शुरू किया जा सकता है, और जरूरत पड़ने पर उसी prompt को और specific बनाया या उसमें जोड़ किया जा सकता है
- thread को शुरुआत में latest game state दी जाती है, लेकिन project की पूरी history नहीं
- कई threads एक साथ "run" हो सकते हैं, लेकिन हर thread में एक समय में सिर्फ एक prompt चल सकता है
- अब तक यह काफी अच्छी तरह काम कर रहा है
- tests में 5 लोगों ने एक ही world पर साथ काम किया; थोड़ी अव्यवस्था जरूर थी, लेकिन यह फिर भी functional रहा
- users बेहतर तरीके से coordinate कर सकें, इसके लिए सक्रिय रूप से तरीकों की खोज की जा रही है
benchmarking और testing
- prompt engine की performance जाँचने के लिए benchmarking tool बनाया गया
- यह tool दर्जनों scenarios चलाता है, जिनमें हर एक का अपना unique prompt होता है, और फिर GPT का उपयोग करके यह आकलन करता है कि prompt सफल रहा या नहीं
- एक दूसरे GPT को, जिसे "evaluator" कहा गया है और जिसका अपना system prompt है, ये conditions, completion के समय की simulated state, और आई हुई सभी errors दी जाती हैं; फिर उससे पूछा जाता है कि test सफल था या नहीं
- test suite अभी शुरुआती चरण में है, लेकिन जैसे-जैसे नए prompt styles और failure cases मिल रहे हैं, वैसे-वैसे अधिक tests जोड़े जा रहे हैं
Braindump क्यों बना रहे हैं
- व्यक्तिगत रूप से, उन्हें हमेशा games और creativity से प्यार रहा है
- generative AI, productivity बढ़ाने का स्वाभाविक अगला चरण है
- इसके जरिए लोग बस और अधिक काम कर सकते हैं
- जब बड़े studios लगातार अधिक conservative games बना रहे हैं, तब छोटे groups या यहाँ तक कि अकेले व्यक्तियों को अपने dream game बनाने में सक्षम करना खुशी की बात है
- वे देखना चाहते हैं कि जब लोगों की उंगलियों पर पूरा AI game studio होगा, तो वे कौन-कौन से पागलपन भरे ideas सोचेंगे और उन्हें कैसे सच करेंगे
आगे की योजना
- Braindump अभी बस शुरुआत में है
- अभी यह "commands" चलाने में काफी अच्छा है, जैसे: "cat बनाओ", लेकिन यह भी स्पष्ट है कि इसे और अधिक अस्पष्ट या "बड़े" tasks सँभालने लायक बढ़ाया जा सकता है
- फिलहाल इन बातों पर शोध हो रहा है
- Planning के जरिए "बड़े" prompts का समर्थन
- GPT को अनुमान लगाना बंद कराकर, उसकी जगह user से clarification माँगने के लिए प्रेरित करना
- GPT से अपने काम की आलोचना करवाकर code quality सुधारना
- discoverability और inspiration बेहतर करना, जैसे: "मैं इससे क्या बना सकता हूँ?"
- game engine features को ऐसे रूप में सुधारना जो LLM के लिए उपयुक्त हो
अभी कोई टिप्पणी नहीं है.