• बिना supervision के भी 6 प्रकार के modality डेटा को एक साथ bind करके विभिन्न प्रकार की जानकारी का बेहतर विश्लेषण करता है
    • image, video, audio, text, depth, thermal, IMU (inertial measurement unit)
    • sound के आधार पर image generate करना, या audio/video/image/depth डेटा को मिलाकर information retrieval जैसे काम संभव हैं
  • बेहतरीन Zero-shot / Few-Shot recognition performance

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.