- ChatGPT और Visual Foundation Model को जोड़कर, चैट के दौरान इमेज भेजने और पाने का सपोर्ट
- ChatGPT भाषा-आधारित learning पर प्रशिक्षित है, इसलिए इमेज processing और generation नहीं कर सकता
- VFM इमेज को समझ और process कर सकता है, लेकिन केवल एक बार के input और output तक सीमित है
- दोनों को जोड़कर इमेज generation, बनाई गई इमेज में बदलाव, भेजी गई इमेज के भीतर किसी खास वस्तु को हटाना या बदलना आदि संभव
- भाषा के साथ इमेज भी भेजी जा सकती है
- जटिल visual सवालों या editing commands के लिए multi-step AI models के बीच collaboration
- संशोधित नतीजों पर feedback आदि
1 टिप्पणियां
एक बार रास्ता खुल गया, तो सच में बहुत तेज़ी से प्रगति हो रही है।