ocap - डेस्कटॉप की हर चीज़ रिकॉर्ड करने वाला हाई-परफॉर्मेंस रिकॉर्डर
(github.com/open-world-agents)AI एजेंट ट्रेनिंग के लिए डेस्कटॉप डेटा इकट्ठा करने हेतु बनाया गया, लेकिन सामान्य उपयोग के लिए भी काम आने वाला ओपन सोर्स रिकॉर्डर ocap (Omnimodal CAPture) है।
OBS जैसे मौजूदा रिकॉर्डिंग टूल अक्सर सिर्फ वीडियो सेव करते हैं, या कई तरह के डेटा को सिंक करके सेव नहीं कर पाते। AI ट्रेनिंग के लिए "यूज़र ने कब कौन-सी key दबाई, माउस कहाँ ले गया, और कौन-सी window active थी" तक का synchronized डेटा चाहिए। इसे हल करने के लिए इसे बनाया गया है।
विशेषताएँ:
- स्क्रीन वीडियो + ऑडियो + keyboard/mouse events + window events को nanosecond स्तर पर synchronize करके रिकॉर्ड करता है
- hardware-accelerated encoding (H265/HEVC, NVIDIA GPU)
- एक ही कमांड से रिकॉर्डिंग शुरू/बंद:
ocap my-recording→ Ctrl+C - core logic एक ही Python file (~400 lines) में है, इसलिए customization आसान है
- GStreamer आधारित होने के कारण Linux/macOS तक विस्तार योग्य संरचना
- output: .mkv (वीडियो) + .mcap (event log, robotics में पहले से validated MCAP format)
इंस्टॉल:
conda install open-world-agents::gstreamer-bundle
pip install ocap
या release page से zip डाउनलोड करके run.bat चलाया जा सकता है।
इसे मूल रूप से डेस्कटॉप डेटा के साथ Embodied AI को train करने वाले D2E research project (https://worv-ai.github.io/d2e/) के लिए विकसित किया गया था, लेकिन यह सामान्य-purpose desktop recording tool के रूप में भी उपयोगी था, इसलिए इसे अलग package के रूप में विभाजित किया गया।
फ़िलहाल केवल Windows + NVIDIA GPU environment समर्थित है, और AMD/Intel GPU या दूसरे OS का समर्थन ऐसी संरचना में है जहाँ सिर्फ GStreamer pipeline बदलनी होगी।
GitHub: https://github.com/open-world-agents/ocap
PyPI: https://pypi.org/project/ocap/
अभी कोई टिप्पणी नहीं है.