LLaVA: Visual Instruction Tuning

xguru · 2023-04-22T10:32:01+09:00

"LLaVA : Large Language and Vision Assistant" सामान्य visual और language understanding के लिए vision encoder और Vicuna को मिलाने वाला बड़ा multimodal model multimodal GPT-4 स्तर की क्षमताओं और science question-answering में SOTA accuracy हासिल करने का लक्ष्य पेपर, कोड और डेमो जारी

(llava-vl.github.io)

6 पॉइंट द्वारा xguru 2023-04-22 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

"LLaVA : Large Language and Vision Assistant"
सामान्य visual और language understanding के लिए vision encoder और Vicuna को मिलाने वाला बड़ा multimodal model
multimodal GPT-4 स्तर की क्षमताओं और science question-answering में SOTA accuracy हासिल करने का लक्ष्य
पेपर, कोड और डेमो जारी

LLaVA: Visual Instruction Tuning

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.