- Google ने Gemini 2.0 Flash मॉडल के जरिए image generation फीचर को developer preview के रूप में जारी किया
- टेक्स्ट-आधारित commands से image generation, modification और partial editing तक संभव है, और visual quality तथा text rendering में भी सुधार हुआ है
- product reskin, SKU generation, real-time collaborative editing जैसे कई उपयोग मामलों का परिचय दिया गया
- [Google AI Studio] और [Vertex AI] के जरिए इसे तुरंत टेस्ट किया जा सकता है, और API usage limits भी बढ़ाए गए हैं
Gemini 2.0 Flash image generation फीचर प्रीव्यू जारी
- डेवलपर्स के feedback के आधार पर, Google ने Gemini 2.0 Flash मॉडल के जरिए image generation फीचर को preview version में उपलब्ध कराया है
- उपयोगकर्ता इसे Google AI Studio या Vertex AI के माध्यम से इस्तेमाल कर सकते हैं
मुख्य सुधार
- visual quality में सुधार (पिछले experimental version की तुलना में)
- text rendering की accuracy में सुधार
- filter blocking rate में कमी
उपयोग के लिए उपलब्ध image generation फीचर्स के उदाहरण
- product image re-backgrounding: मौजूदा product photos को विभिन्न backgrounds और environments के साथ फिर से तैयार किया जा सकता है
- real-time collaborative editing: Gemini Co-Drawing ऐप में multi-user real-time image editing support
- image के किसी हिस्से की conversational editing: पूरी image बदले बिना सिर्फ किसी खास हिस्से को interactive commands से modify किया जा सकता है
- product SKU का dynamic generation: image और text को मिलाकर नए product variants (color, label आदि) अपने-आप generate किए जा सकते हैं
- Gemini के साथ idea generation collaboration: text+image combination के जरिए cooking, product, planning जैसे कई scenarios लागू किए जा सकते हैं
API usage example (Python)
from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
model="gemini-2.0-flash-preview-image-generation",
contents=("Show me how to bake a macaron with images."),
config=types.GenerateContentConfig(
response_modalities=["TEXT", "IMAGE"]
),
)
आगे की योजना
- Google आगे और बेहतर quality, नए फीचर्स, speed improvements और pricing plans में सुधार के साथ इस फीचर का विस्तार जारी रखेगा
- विस्तृत दस्तावेज़ के लिए Gemini API image generation guide देखें
1 टिप्पणियां
Hacker News राय