(मूल लेख में system prompt, code snippets और gif शामिल हैं)
- Google AI Studio को update किया गया है, और इसके साथ Gemini का उपयोग करने वाले कई mini apps (Starter Apps) के साथ खेलने के लिए एक जगह जोड़ी गई है
- 10+ demos को code बदलते हुए चलाया जा सकता है। built-in Gemini API Key का उपयोग होता है, इसलिए मुफ़्त है
- लेकिन बहुत ज़्यादा इस्तेमाल करने पर 400 error आता है। लगता है जैसे कोई daily call limit हो
- किसी दूसरे account से करने पर चल जाता है
अंदाज़ा लगाएँ: Google ने ये demos सार्वजनिक क्यों किए होंगे?
- हाल के समय में Gemini सिर्फ text से आगे बढ़कर image और video को समझने और generate करने वाली multimodal क्षमताओं और शानदार coding ability की वजह से ध्यान खींच रहा है।
- लेकिन ज़्यादातर उपयोग अब भी LLM chatbot के भीतर ही होता है, और आम लोग इसे API level पर ज़्यादा इस्तेमाल नहीं कर रहे थे
- शायद Google ने ये demos इस उम्मीद से पेश किए हैं कि ये क्षमताएँ API के रूप में भी खूब इस्तेमाल हों और उससे कमाई हो
- क्योंकि हर demo यह दिखाने वाला showcase है कि Gemini की क्षमताओं को code level पर दूसरे Google APIs के साथ जोड़कर web app के रूप में कैसे implement किया जा सकता है
Demo prompts और code analysis
ज़्यादा complex वाले 2 examples देखे
Video Toys: video को समझना और समझाना + vibe coding example
- यह demo YouTube video को Gemini 2.5 से analyze करके, एक आसान interactive educational materials app को vibe coding के ज़रिए बनाकर देता है
- यह video का analysis "interactive web app के ज़रिए educational experience बनाने में विशेषज्ञ education theorist और product designer" के रूप में करता है, फिर उस web app का spec बनाता है, और फिर उसे implement करता है
- sample video का content पहले से analyze किया हुआ है, इसलिए educational materials app को तुरंत चलाकर देखा जा सकता है
- कुछ files वाले दूसरे demo apps से अलग, यह React से बना है
- Gemini द्वारा बनाए गए vibe coding spec और तैयार code, दोनों को user edit कर सकता है
- जो लोग video आधारित service या code generation service बनाना चाहते हैं, उनके लिए सिफ़ारिश की जाती है
Maps Planner: multimodal + function use + structured output + maps API example
- किसी place name को देने पर उसके बारे में समझाता है, और Day Planner Mode चालू करने पर पूरे दिन का travel plan बना देता है। यात्रा में लगने वाला समय भी estimate करता है
- General Explorer Mode और Day Planner Mode, इन 2 modes को एक ही system prompt से support करता है
- user ने कौन सा mode चुना है, उसके अनुसार system prompt को हल्का-सा बदलना प्रभावशाली लगा
- map data को सटीक रूप से input/output करने और दो locations के बीच line सही ढंग से खींचने वाला function define किया गया है, जिसे Gemini call करता है
- MCP के ज़रिए जो extensibility हासिल करनी है, शायद वह कुछ ऐसी ही होगी
- prompt तो अच्छा है ही, map API और location data को handle करने का तरीका भी अच्छी तरह दिखाया गया है। map-related service बनाना चाहने वालों के लिए सिफ़ारिश की जाती है
खुद बनाकर देखना
- demo app को copy करके customize किया जा सकता है। शुरुआत से बनाने वालों के लिए बहुत से templates भी हैं
- Explain Things with Lots of Tiny Cats नाम के image generation demo को copy करके मैंने अपना version बनाया
- यह ऐसा demo है जो किसी concept की explanation माँगने पर कई बिल्लियों के metaphor के ज़रिए एक तरह का webtoon बना देता है
- image generation को लगातार जारी रखने वाला prompt (No commentary, just begin your explanation. Keep going until you're done.) और इस तरह generated images को stream में एक-एक करके दिखाने वाला code, दोनों प्रभावशाली थे
- इसे Korean + hippo version में बदलकर हिप्पो को सब पता है बनाया
- Google Fonts से एक उपयुक्त Korean font लाया गया और HTML code व prompt में हल्का बदलाव किया गया
- अपना app share करने की सुविधा है, लेकिन यह ठीक से काम नहीं करती
- क्योंकि सभी संबंधित files Google Drive में save होती हैं, इसलिए सीधे Google Drive में जाकर file share करने जैसा करें तो काम हो जाता है
Gemini Cookbook
- Starter Apps जहाँ मज़ेदार web app examples थे, वहीं यहाँ कई तरह के Python examples दिए गए हैं
- कुछ घंटे पहले जारी किए गए Gemini 2.5 Flash examples भी हैं
- generative AI service बनाने वालों के लिए यह संदर्भ के रूप में काफ़ी उपयोगी है
अभी कोई टिप्पणी नहीं है.