- Segment Anything Model 2 इमेज और वीडियो में promptable visual segmentation समस्या को हल करने के लिए एक मॉडल है
- इमेज को single-frame वीडियो मानकर इसे वीडियो तक विस्तारित किया गया है
- real-time वीडियो प्रोसेसिंग के लिए streaming memory के साथ एक सरल transformer architecture का उपयोग करता है
- उपयोगकर्ता इंटरैक्शन के जरिए मॉडल और डेटा को बेहतर बनाने वाला data engine बनाकर SA-V dataset एकत्र किया गया
- यह विभिन्न कार्यों और visual domains में मजबूत प्रदर्शन प्रदान करता है
- Segment Anything Video (SA-V) dataset भी जारी किया गया
- इसमें 50,583 विविध वीडियो और 642,036 उच्च-गुणवत्ता वाले spatiotemporal segmentation masks (Masklet) शामिल हैं
- CC by 4.0 लाइसेंस
2 टिप्पणियां
Segment Anything Model(SAM) : इमेज से किसी भी ऑब्जेक्ट को निकालने वाला Meta का AI मॉडल
SAM.cpp - Meta के Segment Anything Model का शुद्ध C/C++ में इम्प्लीमेंटेशन
Hacker News की राय
mIoU और image processing speed में 6 गुना सुधार दिलचस्प है
Segment Anything टीम ने SAM 2 मॉडल जारी किया है
SAM 1 को पहले इस्तेमाल किया है
video frame को classify करके किसी खास frame को ढूँढने वाला model train करना चाहता हूँ
SAM loss function का बड़ा प्रशंसक हूँ
web demo बहुत साफ़-सुथरा है
SAM का पहला model सबसे उपयोगी था
research demo Illinois और Texas में उपलब्ध नहीं है
military use को लेकर चिंता है
यह चौंकाने वाली उपलब्धि है