प्राकृतिक भाषा में YouTube वीडियो के अंदर खोज
(github.com)- OpenAI के CLIP neural network का उपयोग करके वीडियो के अंदर किसी खास दृश्य को खोजें
→ "Road Works", "People crossing the street", "Fire truck" जैसे वीडियो के भीतर की इमेज खोज सकते हैं
काम करने का तरीका
-
YouTube वीडियो डाउनलोड करें
-
हर frame निकालें
-
सभी frames को CLIP से encode करें
-
CLIP से natural language search को encode करें
-
natural language search से खास scene खोजें
- Google Colab में notebook के रूप में सीधे चलाया जा सकता है
1 टिप्पणियां
कॉमेंट्स में उसी डेवलपर ने Unsplash की image search भी CLIP से बनाई है, यह भी काफ़ी उपयोगी लगती है
https://github.com/haltakov/natural-language-image-search
Google Colab : https://colab.research.google.com/github/haltakov/…
Unsplash पर अपलोड की गई 20 लाख फ़ोटो में से यह आपकी मनचाही सामग्री वाली तस्वीरें ढूंढ देता है.