VibeFrame - coding agents के लिए storyboard-आधारित वीडियो CLI
(github.com/vericontext)नमस्ते।
इन दिनों मैं यह प्रयोग कर रहा हूँ कि Codex / Claude Code / Cursor जैसे coding agents के साथ वीडियो काम को कितनी दूर तक ले जाया जा सकता है, और इसी दौरान VibeFrame नाम का एक CLI बना रहा हूँ।
मुझे लगा कि ज़्यादातर मौजूदा वीडियो टूल्स में state UI के अंदर होती है, इसलिए agents के लिए उन्हें संभालना कठिन होता है। इसलिए मैं इसे इस दिशा में बना रहा हूँ कि वीडियो प्रोजेक्ट्स को जितना संभव हो सके code projects की तरह संभाला जाए।
बेसिक flow इस प्रकार है।
- STORYBOARD.md: scene, narration, timing, image/video generation cue
- DESIGN.md: tone, layout, typography, motion direction
- vibe build: asset generation + scene composition
- vibe render: MP4 rendering
- vibe inspect: render result inspection
असल में इसे इस तरह इस्तेमाल किया जाता है।
curl -fsSL https://vibeframe.ai/install.sh | bash
vibe setup --scope project
vibe init launch --from brief.md
# Codex / Claude Code / Cursor आदि से
# STORYBOARD.md और DESIGN.md को research content के आधार पर update करवाने के बाद
vibe build launch --dry-run
vibe build launch
vibe render launch
vibe inspect render launch --cheap
scene composition वाला हिस्सा Hyperframes के आइडिया से काफी प्रभावित है। इसमें वीडियो scenes को timeline पर HTML/CSS/JS composition की तरह देखा जाता है, और browser में deterministic तरीके से capture करके MP4 के रूप में render किया जाता है।
VibeFrame उसके ऊपर ऐसा project layer जोड़ने के अधिक करीब है जिसे coding agents आसानी से संभाल सकें। इसमें STORYBOARD.md / DESIGN.md को source of truth रखा गया है, और multi-provider image/video/narration/music generation, FFmpeg-आधारित edit/remix, JSON output, dry-run, project-scoped config, inspect report जैसे agentic workflows जोड़े गए हैं।
इस डेमो में, vibe setup --scope project के बाद केवल vibe init launch किया गया है। फिर coding agent से किसी खास विषय पर research करवाई गई, STORYBOARD.md / DESIGN.md को update कराया गया, और image generation cue सहित final MP4 तक build करने की प्रक्रिया रिकॉर्ड की गई।
पूरा process वीडियो:
https://t.co/YD0SYyODcQ
यह अभी शुरुआती चरण में है, इसलिए खास तौर पर नीचे दिए गए हिस्सों पर feedback जानना चाहता हूँ।
- क्या वीडियो काम के लिए STORYBOARD.md + DESIGN.md को agent interface के रूप में रखना स्वाभाविक लगता है
- क्या build / generate / edit-remix इन तीन workflow lanes का विभाजन समझने में आसान है
- क्या CLI surface बहुत चौड़ा लगता है, या उल्टा कोई ज़रूरी feature गायब दिखता है
यह वीडियो editing को GUI के बजाय agentic CLI में लाने की कोशिश है, इसलिए जिन लोगों ने इसी तरह की समस्या का सामना किया है, उनकी राय सुनना चाहूँगा।
अभी कोई टिप्पणी नहीं है.