नमस्ते।

इन दिनों मैं यह प्रयोग कर रहा हूँ कि Codex / Claude Code / Cursor जैसे coding agents के साथ वीडियो काम को कितनी दूर तक ले जाया जा सकता है, और इसी दौरान VibeFrame नाम का एक CLI बना रहा हूँ।

मुझे लगा कि ज़्यादातर मौजूदा वीडियो टूल्स में state UI के अंदर होती है, इसलिए agents के लिए उन्हें संभालना कठिन होता है। इसलिए मैं इसे इस दिशा में बना रहा हूँ कि वीडियो प्रोजेक्ट्स को जितना संभव हो सके code projects की तरह संभाला जाए।

बेसिक flow इस प्रकार है।

  • STORYBOARD.md: scene, narration, timing, image/video generation cue
  • DESIGN.md: tone, layout, typography, motion direction
  • vibe build: asset generation + scene composition
  • vibe render: MP4 rendering
  • vibe inspect: render result inspection

असल में इसे इस तरह इस्तेमाल किया जाता है।

curl -fsSL https://vibeframe.ai/install.sh | bash  
vibe setup --scope project  
vibe init launch --from brief.md  
  
# Codex / Claude Code / Cursor आदि से  
# STORYBOARD.md और DESIGN.md को research content के आधार पर update करवाने के बाद  
  
vibe build launch --dry-run  
vibe build launch  
vibe render launch  
vibe inspect render launch --cheap  

scene composition वाला हिस्सा Hyperframes के आइडिया से काफी प्रभावित है। इसमें वीडियो scenes को timeline पर HTML/CSS/JS composition की तरह देखा जाता है, और browser में deterministic तरीके से capture करके MP4 के रूप में render किया जाता है।

VibeFrame उसके ऊपर ऐसा project layer जोड़ने के अधिक करीब है जिसे coding agents आसानी से संभाल सकें। इसमें STORYBOARD.md / DESIGN.md को source of truth रखा गया है, और multi-provider image/video/narration/music generation, FFmpeg-आधारित edit/remix, JSON output, dry-run, project-scoped config, inspect report जैसे agentic workflows जोड़े गए हैं।

इस डेमो में, vibe setup --scope project के बाद केवल vibe init launch किया गया है। फिर coding agent से किसी खास विषय पर research करवाई गई, STORYBOARD.md / DESIGN.md को update कराया गया, और image generation cue सहित final MP4 तक build करने की प्रक्रिया रिकॉर्ड की गई।

पूरा process वीडियो:
https://t.co/YD0SYyODcQ

यह अभी शुरुआती चरण में है, इसलिए खास तौर पर नीचे दिए गए हिस्सों पर feedback जानना चाहता हूँ।

  • क्या वीडियो काम के लिए STORYBOARD.md + DESIGN.md को agent interface के रूप में रखना स्वाभाविक लगता है
  • क्या build / generate / edit-remix इन तीन workflow lanes का विभाजन समझने में आसान है
  • क्या CLI surface बहुत चौड़ा लगता है, या उल्टा कोई ज़रूरी feature गायब दिखता है

यह वीडियो editing को GUI के बजाय agentic CLI में लाने की कोशिश है, इसलिए जिन लोगों ने इसी तरह की समस्या का सामना किया है, उनकी राय सुनना चाहूँगा।

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.