AV2 वीडियो मानक जारी, अंतिम v1.0 स्पेसिफिकेशन सार्वजनिक
(av2.aomedia.org)- AV2 AOMedia का अगली पीढ़ी का वीडियो कोडिंग स्पेसिफिकेशन है, जिसका लक्ष्य AV1 के आधार पर अधिक compression efficiency और कम bitrate पर high-quality डिलीवरी हासिल करना है
- अंतिम v1.0.0 स्पेसिफिकेशन में bitstream syntax, semantics और decoding procedures शामिल हैं, और यह AV2 implementation conformity तय करने के लिए एक technical reference का काम करता है
- इसे streaming, broadcasting और real-time video conferencing के लिए optimize किया गया है, और AR/VR, split-screen delivery तथा screen content processing improvements का भी समर्थन करता है
- मौजूदा release में 28 मई 2026 को जारी AV2 Bitstream & Decoding Process Specification v1.0.0 और AVM reference software शामिल हैं
- implementers online spec, PDF, C header lookup tables, Syntax Browser, और AVM v1.0.0 tag का उपयोग कर सकते हैं, जबकि v13 draft केवल reference के लिए रखा गया है
AV2 अवलोकन
- AV2 Alliance for Open Media(AOMedia) का अगली पीढ़ी का वीडियो कोडिंग स्पेसिफिकेशन है, जिसे AV1 के आधार पर अधिक compression efficiency देने के लिए डिज़ाइन किया गया है
- इसका लक्ष्य काफी कम bitrate पर high-quality video डिलीवर करना है, और इसे streaming, broadcasting तथा real-time video conferencing की ज़रूरतों के अनुसार optimize किया गया है
- v1.0.0 स्पेसिफिकेशन AV2 implementation के लिए अंतिम technical reference है, जिसमें पूर्ण conformity के लिए आवश्यक bitstream syntax, semantics और decoding procedures शामिल हैं
- AV2 AR/VR applications, कई programs की split-screen delivery, बेहतर screen content processing, और visual quality की अधिक व्यापक range में operation का समर्थन करता है
- implementers के लिए आधिकारिक reference software के रूप में AOMedia Video Model(AVM) उपलब्ध कराया गया है
- feedback और issues को wg-codec-chair@aomedia.org पर भेजा जा सकता है या AVM issue tracker में दर्ज किया जा सकता है
रिलीज़ और implementation संसाधन
-
AV2 specification and reference code v1.0.0
- मौजूदा release में 28 मई 2026 को जारी AV2 Bitstream & Decoding Process Specification v1.0.0 और उससे संबंधित AVM reference software शामिल हैं
- Read Online: v1.0.0 स्पेसिफिकेशन का ऑनलाइन दस्तावेज़
- Download PDF: पूर्ण v1.0.0 स्पेसिफिकेशन PDF
- Additional Tables: सेक्शन 9 से निकाली गई lookup tables की C header file
- Syntax Browser: syntax structures और semantics को साथ में देखने के लिए browser
- Software: v1.0.0 tag वाला AVM reference software
-
AV2 working draft v13
- v13 working draft 5 जनवरी 2026 को जारी किया गया था और अब इसे v1.0.0 ने replace कर दिया है
- “v13” label working draft milestone को दर्शाता है, इसका मतलब यह नहीं है कि यह v1.0.0 से नया version है
- इसे reference purpose के लिए संरक्षित रखा गया है
- Read Online: v13 ऑनलाइन दस्तावेज़
- Additional Tables: v13 की अतिरिक्त tables
- Syntax Browser: v13 syntax browser
- Software: research-v13.0.0 reference software
- Release Notes: v13 release notes
-
स्पेसिफिकेशन उपयोग संसाधन
- पूर्ण स्पेसिफिकेशन में scope और definitions से लेकर appendices तक सब शामिल है, और यह format, syntax, semantics तथा decoding procedures को समेटता है
- PDF version offline reference के लिए पूर्ण v1.0.0 स्पेसिफिकेशन उपलब्ध कराता है
- Additional Tables सेक्शन 9 की lookup tables को C header file के रूप में निकालकर देता है, जो implementation reference के लिए उपयोगी हैं
- Syntax Browser सेक्शन 5 की Syntax Structures और सेक्शन 6 की Semantics को split-pane interface में उपलब्ध कराता है
- Syntax Browser में syntax definitions और semantics को side-by-side देखना, clickable syntax elements, दोनों sections में search, और syntax structures की copy जैसी सुविधाएँ उपलब्ध हैं
- Reference Software स्पेसिफिकेशन v1.0.0 के अनुरूप AVM है, और v1.0.0 tag उसी version को दर्शाता है
1 टिप्पणियां
Hacker News की राय
AV2 बहुत लंबे सफर का सिर्फ एक पड़ाव है, और मौजूदा हालत में इसे व्यवहारिक रूप से इस्तेमाल करना मुश्किल लगता है
अच्छे hardware पर भी encoder आमतौर पर लगभग 1fps ही देता है, इसलिए 2028 के आसपास पहला AV2 hardware acceleration chip आने तक हालात ऐसे ही रहने की संभावना है, और AV2 stream आम होने में शायद 2030 तक लग जाए
सिर्फ efficiency improvement देखें तो AV1 के मुकाबले 20~30% काफी बड़ा है, लेकिन AV2 उसकी कीमत वसूल करता है या नहीं, यह साफ नहीं है। लेकिन multi-stream support VR और live sports के लिए बड़ा फायदा है, और alpha channel को अलग stream में भेजकर file में compose करके सही transparent video support किया जा सकता है, यह भी दिलचस्प है
spec final हो चुकी है, इसलिए असली product encoder में speed काफी बेहतर हो सकती है, हालांकि real-time encoding hardware में आने से पहले मुश्किल ही रहेगी
जब तक chip निर्माता AV2 design को पुराने और सस्ते process पर नहीं ले जाते, तब तक आम उपयोगकर्ताओं के लिए यह मुश्किल है। चीन के TV chip निर्माता checkbox भरने के लिए AV2 decoder जोड़ सकते हैं, लेकिन असली encoder की उम्मीद फिलहाल कठिन है
data center में खरबों का निवेश होने के दौर में traffic cost पीछे छूट जाती है, और इसका फायदा शायद सिर्फ YouTube या Netflix जैसी कंपनियों को होगा। उस पैमाने पर तो ISP-स्तर cache में निवेश करना शायद ज्यादा सस्ता पड़े
जिज्ञासा है कि AV2 AVIF image format को कैसे बेहतर करेगा। AVIF low-bitrate still images में, खासकर chroma subsampling के साथ, competing format को पीछे छोड़ देता है
लेकिन lossless image में ऐसा नहीं है। lossless JPEG XL और lossless WEBP की तुलना में lossless AVIF तो लगभग मजाक जैसा लगता है
बहुत अधिक compress की गई images में भी यह शानदार है, और file size कितना छोटा हो सकता है, यह चौंकाता है। HEIC या Ultra HDR JPEG के विपरीत, यह sidecar gain map जैसी तरकीब नहीं बल्कि file format के भीतर ही HDR को natively support करता है। यह सबके लिए जरूरी नहीं होगा, लेकिन मुझे HDR पसंद है, और AVIF ही वह format लगता है जो इसे गंभीरता से लेता है
AV1 को लेकर अभी कई कंपनियाँ सक्रिय रूप से claim chart बना रही हैं, और मुकदमे लगभग तय लगते हैं। AV2 में भी वही प्रक्रिया शुरू हो चुकी है, लेकिन ज्यादातर लोग AV1 के मामलों के पकने का इंतजार कर रहे हैं
लोग AV परिवार के codec को लगातार “royalty-free” कहते हैं, लेकिन असल में यह बढ़ते हुए कानूनी और वित्तीय दाँव जैसा लगता है
मैं कभी नहीं समझ पाया कि कुछ लोगों को कंपनियों द्वारा गणित पर मालिकाना हक जताने का विचार ऐसे क्यों पसंद है जैसे वे किसी स्थानीय sports team का समर्थन कर रहे हों
कुछ समय तक लगा कि H.264 encoder पर बहुत मेहनत करने वाले लोग होंगे, इसलिए digital sharecropper जैसे लोग अव्यवस्थित आजादी का समर्थन करने वालों से नाराज़ और ईर्ष्यालु हैं। लेकिन लगता है कुछ लोग बस इस विचार का आनंद लेते हैं कि कंपनियाँ video distribution पर टैक्स लगा सकें
अच्छी बात यह है कि वे लालची कंपनियाँ बार-बार खुद को ही नुकसान पहुँचाती रही हैं, और उनका प्रभाव घट रहा है
compression standard के आसपास हमेशा गिद्ध मंडराते हैं, इसलिए इसे बहुत गंभीरता से लेने की जरूरत नहीं है। अगर मुकदमा दायर भी हो, तो निराधार दावों का मुकाबला करने के लिए legal defense fund मौजूद है
H.265 के लिए दो HEVC license pool हैं जिनमें शामिल होना पड़ता है, और pool के बाहर भी कम से कम दो कंपनियाँ हैं
https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#P...
AVx के अलावा कोई codec चुन लेने से यह कम जटिल या मुकदमे के जोखिम से कम भरा हुआ नहीं हो जाता
इस standard को कोई implement करे और फिर Adobe या Dolby जैसी किसी कंपनी की मार खाने की इच्छा के कारण उस पर मुकदमा चल जाए — इसमें कितना समय लगेगा? मेरी जानकारी पुरानी हो सकती है, लेकिन अगर यह AV1 जितना “open” है, तो मुझे काफी संदेह है कि अलग-अलग कंपनियाँ इसे वास्तव में अनुमति देंगी। लालच भी एक कारण है
दिलचस्प बात यह है कि वह उस patent pool से नहीं आया था जिसका नाम पिछले कुछ वर्षों से लगातार खबरों में रहा है। यानी ऐसी कोशिश सामने आने में काफी समय लग सकता है
आधा मज़ाक में कहूँ तो, मैं AV1 सपोर्ट वाले Apple TV का इंतज़ार कर रहा था, लेकिन अब लगता है कि Apple TV के AV2 सपोर्ट का भी इंतज़ार करना पड़ेगा
इसलिए यह मानना सुरक्षित है कि मौजूदा Apple TV डिवाइस भी software से AV1 वीडियो चला सकते हैं। Apple TV के लिए VLC release भी उपलब्ध है
https://www.videolan.org/vlc/download-appletv.html
https://apps.apple.com/us/app/vlc-media-player/id650377962?p...
मैं वीडियो encoding का विशेषज्ञ नहीं हूँ, लेकिन सोचता हूँ कि क्या भविष्य में fixed-function compression के बजाय AI network पर ज़्यादा निर्भरता हो सकती है, जो वीडियो को reconstruct करके compressed video से भी कहीं हल्का बना दे
github.com/Orange-OpenSource/Cool-Chic जैसे neural codec उसके उदाहरण हैं
हालांकि, यह कहना मुश्किल है कि AI-आधारित codec बैटरी उपयोग के मामले में fixed-function hardware से टक्कर ले पाएँगे या नहीं
AV1 पहले ही efficient और open video format की दिशा में एक बड़ी छलांग था, और AV2 का भी लंबे समय से इंतज़ार था
chips और hardware में इसके implement होने और efficient, तेज hardware encoding·decoding का उपयोग होने में समय लगेगा, लेकिन storage की बढ़ती कीमतों और chip crisis को देखते हुए लगभग 25% efficiency improvement बहुत आशाजनक लगती है
Dav2d उतना अच्छा नहीं सुनाई देता। उससे पहले उम्मीद है कि repository name पर अच्छे wordplay वाला कोई व्यक्ति योगदान दे दे
avi2ude? av2go?
फ़्रेंच में यह d2vid, यानी Deuvid बनता है
उम्मीद है कि कोई काफ़ी तेज encoder आएगा। AV1 का reference encoder भी बहुत अच्छा नहीं था, और यहाँ भी शायद वही स्थिति है
लेकिन जैसे ही SVT-AV2 जैसा कुछ आता है, मैं काफ़ी संतुष्ट हो जाऊँगा