1 पॉइंट द्वारा GN⁺ 4 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • AV2 AOMedia का अगली पीढ़ी का वीडियो कोडिंग स्पेसिफिकेशन है, जिसका लक्ष्य AV1 के आधार पर अधिक compression efficiency और कम bitrate पर high-quality डिलीवरी हासिल करना है
  • अंतिम v1.0.0 स्पेसिफिकेशन में bitstream syntax, semantics और decoding procedures शामिल हैं, और यह AV2 implementation conformity तय करने के लिए एक technical reference का काम करता है
  • इसे streaming, broadcasting और real-time video conferencing के लिए optimize किया गया है, और AR/VR, split-screen delivery तथा screen content processing improvements का भी समर्थन करता है
  • मौजूदा release में 28 मई 2026 को जारी AV2 Bitstream & Decoding Process Specification v1.0.0 और AVM reference software शामिल हैं
  • implementers online spec, PDF, C header lookup tables, Syntax Browser, और AVM v1.0.0 tag का उपयोग कर सकते हैं, जबकि v13 draft केवल reference के लिए रखा गया है

AV2 अवलोकन

  • AV2 Alliance for Open Media(AOMedia) का अगली पीढ़ी का वीडियो कोडिंग स्पेसिफिकेशन है, जिसे AV1 के आधार पर अधिक compression efficiency देने के लिए डिज़ाइन किया गया है
  • इसका लक्ष्य काफी कम bitrate पर high-quality video डिलीवर करना है, और इसे streaming, broadcasting तथा real-time video conferencing की ज़रूरतों के अनुसार optimize किया गया है
  • v1.0.0 स्पेसिफिकेशन AV2 implementation के लिए अंतिम technical reference है, जिसमें पूर्ण conformity के लिए आवश्यक bitstream syntax, semantics और decoding procedures शामिल हैं
  • AV2 AR/VR applications, कई programs की split-screen delivery, बेहतर screen content processing, और visual quality की अधिक व्यापक range में operation का समर्थन करता है
  • implementers के लिए आधिकारिक reference software के रूप में AOMedia Video Model(AVM) उपलब्ध कराया गया है
  • feedback और issues को wg-codec-chair@aomedia.org पर भेजा जा सकता है या AVM issue tracker में दर्ज किया जा सकता है

रिलीज़ और implementation संसाधन

  • AV2 specification and reference code v1.0.0

    • मौजूदा release में 28 मई 2026 को जारी AV2 Bitstream & Decoding Process Specification v1.0.0 और उससे संबंधित AVM reference software शामिल हैं
    • Read Online: v1.0.0 स्पेसिफिकेशन का ऑनलाइन दस्तावेज़
    • Download PDF: पूर्ण v1.0.0 स्पेसिफिकेशन PDF
    • Additional Tables: सेक्शन 9 से निकाली गई lookup tables की C header file
    • Syntax Browser: syntax structures और semantics को साथ में देखने के लिए browser
    • Software: v1.0.0 tag वाला AVM reference software
  • AV2 working draft v13

    • v13 working draft 5 जनवरी 2026 को जारी किया गया था और अब इसे v1.0.0 ने replace कर दिया है
    • “v13” label working draft milestone को दर्शाता है, इसका मतलब यह नहीं है कि यह v1.0.0 से नया version है
    • इसे reference purpose के लिए संरक्षित रखा गया है
    • Read Online: v13 ऑनलाइन दस्तावेज़
    • Additional Tables: v13 की अतिरिक्त tables
    • Syntax Browser: v13 syntax browser
    • Software: research-v13.0.0 reference software
    • Release Notes: v13 release notes
  • स्पेसिफिकेशन उपयोग संसाधन

    • पूर्ण स्पेसिफिकेशन में scope और definitions से लेकर appendices तक सब शामिल है, और यह format, syntax, semantics तथा decoding procedures को समेटता है
    • PDF version offline reference के लिए पूर्ण v1.0.0 स्पेसिफिकेशन उपलब्ध कराता है
    • Additional Tables सेक्शन 9 की lookup tables को C header file के रूप में निकालकर देता है, जो implementation reference के लिए उपयोगी हैं
    • Syntax Browser सेक्शन 5 की Syntax Structures और सेक्शन 6 की Semantics को split-pane interface में उपलब्ध कराता है
    • Syntax Browser में syntax definitions और semantics को side-by-side देखना, clickable syntax elements, दोनों sections में search, और syntax structures की copy जैसी सुविधाएँ उपलब्ध हैं
    • Reference Software स्पेसिफिकेशन v1.0.0 के अनुरूप AVM है, और v1.0.0 tag उसी version को दर्शाता है

1 टिप्पणियां

 
GN⁺ 4 시간 전
Hacker News की राय
  • AV2 बहुत लंबे सफर का सिर्फ एक पड़ाव है, और मौजूदा हालत में इसे व्यवहारिक रूप से इस्तेमाल करना मुश्किल लगता है
    अच्छे hardware पर भी encoder आमतौर पर लगभग 1fps ही देता है, इसलिए 2028 के आसपास पहला AV2 hardware acceleration chip आने तक हालात ऐसे ही रहने की संभावना है, और AV2 stream आम होने में शायद 2030 तक लग जाए
    सिर्फ efficiency improvement देखें तो AV1 के मुकाबले 20~30% काफी बड़ा है, लेकिन AV2 उसकी कीमत वसूल करता है या नहीं, यह साफ नहीं है। लेकिन multi-stream support VR और live sports के लिए बड़ा फायदा है, और alpha channel को अलग stream में भेजकर file में compose करके सही transparent video support किया जा सकता है, यह भी दिलचस्प है

    • AV1 का रुझान देखें तो hardware encoding अनिवार्य नहीं है। हो तो अच्छा है, लेकिन मौजूदा encoder एक reference encoder है
      spec final हो चुकी है, इसलिए असली product encoder में speed काफी बेहतर हो सकती है, हालांकि real-time encoding hardware में आने से पहले मुश्किल ही रहेगी
    • अगर “सबसे बड़ा नया feature multi-stream support” है, तो मुझे लगा यह video codec से ज्यादा container format का क्षेत्र है
    • मौजूदा रुझान देखें तो PC में AV2 hardware encoder जल्द देखने को नहीं मिलेगा। सबसे नए और बेहतरीन chip production की क्षमता लगभग पूरी तरह Apple और AI कंपनियों द्वारा खींच ली गई है
      जब तक chip निर्माता AV2 design को पुराने और सस्ते process पर नहीं ले जाते, तब तक आम उपयोगकर्ताओं के लिए यह मुश्किल है। चीन के TV chip निर्माता checkbox भरने के लिए AV2 decoder जोड़ सकते हैं, लेकिन असली encoder की उम्मीद फिलहाल कठिन है
    • GPU development जिस तरह NPU की ओर मुड़ रहा है, उससे यह जल्दी से जल्दी भी 2035 का लक्ष्य जैसा लगता है। निर्माता matrix operation के लिए silicon area को अधिकतम करना चाहेंगे
      data center में खरबों का निवेश होने के दौर में traffic cost पीछे छूट जाती है, और इसका फायदा शायद सिर्फ YouTube या Netflix जैसी कंपनियों को होगा। उस पैमाने पर तो ISP-स्तर cache में निवेश करना शायद ज्यादा सस्ता पड़े
    • लक्ष्य अगर “काफी कम bitrate पर high-quality video देना” है, लेकिन जिन धीमे devices को इसकी जरूरत है वे अभी मौजूद ही नहीं हैं, तो इसका मतलब क्या है, यह समझना मुश्किल है
  • जिज्ञासा है कि AV2 AVIF image format को कैसे बेहतर करेगा। AVIF low-bitrate still images में, खासकर chroma subsampling के साथ, competing format को पीछे छोड़ देता है
    लेकिन lossless image में ऐसा नहीं है। lossless JPEG XL और lossless WEBP की तुलना में lossless AVIF तो लगभग मजाक जैसा लगता है

    • AVIF इस समय मेरा पसंदीदा image format है। lossless, HDR, transparency, browser support — ये सब एक साथ देने वाले format बहुत कम हैं
      बहुत अधिक compress की गई images में भी यह शानदार है, और file size कितना छोटा हो सकता है, यह चौंकाता है। HEIC या Ultra HDR JPEG के विपरीत, यह sidecar gain map जैसी तरकीब नहीं बल्कि file format के भीतर ही HDR को natively support करता है। यह सबके लिए जरूरी नहीं होगा, लेकिन मुझे HDR पसंद है, और AVIF ही वह format लगता है जो इसे गंभीरता से लेता है
    • ऐसा हमेशा नहीं होता https://tonisagrista.com/blog/2023/jpegxl-vs-avif/
    • अगर libavif में AV2 support आ जाए, तो शायद सिर्फ v2.0.0 जैसे version update से ही अतिरिक्त efficiency मिल सके
    • सच कहूँ तो अभी जरूरत AVIF2 की नहीं है। पहले से ही अल्पसंख्यक image format बहुत ज्यादा हैं
  • AV1 को लेकर अभी कई कंपनियाँ सक्रिय रूप से claim chart बना रही हैं, और मुकदमे लगभग तय लगते हैं। AV2 में भी वही प्रक्रिया शुरू हो चुकी है, लेकिन ज्यादातर लोग AV1 के मामलों के पकने का इंतजार कर रहे हैं
    लोग AV परिवार के codec को लगातार “royalty-free” कहते हैं, लेकिन असल में यह बढ़ते हुए कानूनी और वित्तीय दाँव जैसा लगता है

    • ऐसी बातें दशकों से कही जाती रही हैं
      मैं कभी नहीं समझ पाया कि कुछ लोगों को कंपनियों द्वारा गणित पर मालिकाना हक जताने का विचार ऐसे क्यों पसंद है जैसे वे किसी स्थानीय sports team का समर्थन कर रहे हों
      कुछ समय तक लगा कि H.264 encoder पर बहुत मेहनत करने वाले लोग होंगे, इसलिए digital sharecropper जैसे लोग अव्यवस्थित आजादी का समर्थन करने वालों से नाराज़ और ईर्ष्यालु हैं। लेकिन लगता है कुछ लोग बस इस विचार का आनंद लेते हैं कि कंपनियाँ video distribution पर टैक्स लगा सकें
      अच्छी बात यह है कि वे लालची कंपनियाँ बार-बार खुद को ही नुकसान पहुँचाती रही हैं, और उनका प्रभाव घट रहा है
    • AV1 आए कितना समय हुआ? लगभग 8 साल हो गए, फिर भी अब तक विश्वसनीय patent holder सामने नहीं आया
      compression standard के आसपास हमेशा गिद्ध मंडराते हैं, इसलिए इसे बहुत गंभीरता से लेने की जरूरत नहीं है। अगर मुकदमा दायर भी हो, तो निराधार दावों का मुकाबला करने के लिए legal defense fund मौजूद है
    • अगर AV परिवार के codec कानूनी और वित्तीय दाँव जैसे लगते हैं, तो विकल्प क्या है?
      H.265 के लिए दो HEVC license pool हैं जिनमें शामिल होना पड़ता है, और pool के बाहर भी कम से कम दो कंपनियाँ हैं
      https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#P...
      AVx के अलावा कोई codec चुन लेने से यह कम जटिल या मुकदमे के जोखिम से कम भरा हुआ नहीं हो जाता
    • क्या HEVC जैसी चीज़ों की तुलना में भी ऐसा ही है? HEVC में पूरी तरह सुरक्षित रहने के लिए अलग-अलग शर्तों वाले 3 patent pool को भुगतान करना पड़ता है, और इसके अलावा pool में शामिल न होने वाले patent holder भी कभी भी अपनी शर्तों पर royalty मांग सकते हैं
    • संचार मानकों पर patent नहीं होना चाहिए। lock-in effect के जरिए दुरुपयोग की संभावना बहुत ज्यादा है
  • इस standard को कोई implement करे और फिर Adobe या Dolby जैसी किसी कंपनी की मार खाने की इच्छा के कारण उस पर मुकदमा चल जाए — इसमें कितना समय लगेगा? मेरी जानकारी पुरानी हो सकती है, लेकिन अगर यह AV1 जितना “open” है, तो मुझे काफी संदेह है कि अलग-अलग कंपनियाँ इसे वास्तव में अनुमति देंगी। लालच भी एक कारण है

    • AV1 पर पहला patent claim अदालत तक पहुँचने में 7 साल लगे, और उस मामले के सुलझने में भी काफी समय लग सकता है
      दिलचस्प बात यह है कि वह उस patent pool से नहीं आया था जिसका नाम पिछले कुछ वर्षों से लगातार खबरों में रहा है। यानी ऐसी कोशिश सामने आने में काफी समय लग सकता है
    • patent troll बेहद घटिया हैं। अपने फायदे के लिए अमेरिकी न्यायपालिका की स्वतंत्रता को हिलाने वालों का इन्हें पूरा समर्थन मिलने में कितना समय लगेगा? उम्मीद है वह भ्रष्टाचार इससे पहले रुक जाए
  • आधा मज़ाक में कहूँ तो, मैं AV1 सपोर्ट वाले Apple TV का इंतज़ार कर रहा था, लेकिन अब लगता है कि Apple TV के AV2 सपोर्ट का भी इंतज़ार करना पड़ेगा

    • 10 साल पुराना iPhone 7 भी VLC के साथ 1080p AV1 वीडियो को software decoding से 200 मिनट से ज़्यादा चला सकता है। iPhone 7, AV1 से लगभग डेढ़ साल पहले जारी हुआ था
      इसलिए यह मानना सुरक्षित है कि मौजूदा Apple TV डिवाइस भी software से AV1 वीडियो चला सकते हैं। Apple TV के लिए VLC release भी उपलब्ध है
      https://www.videolan.org/vlc/download-appletv.html
      https://apps.apple.com/us/app/vlc-media-player/id650377962?p...
    • Apple ecosystem के बाहर AV1 का सपोर्ट लगभग हर जगह है
  • मैं वीडियो encoding का विशेषज्ञ नहीं हूँ, लेकिन सोचता हूँ कि क्या भविष्य में fixed-function compression के बजाय AI network पर ज़्यादा निर्भरता हो सकती है, जो वीडियो को reconstruct करके compressed video से भी कहीं हल्का बना दे
    github.com/Orange-OpenSource/Cool-Chic जैसे neural codec उसके उदाहरण हैं

    • शायद यह इस बात पर निर्भर करेगा कि क्या smartphone में NPU आम हो जाता है, और क्या NPU तक पहुँचने के लिए standard API बनती है
      हालांकि, यह कहना मुश्किल है कि AI-आधारित codec बैटरी उपयोग के मामले में fixed-function hardware से टक्कर ले पाएँगे या नहीं
  • AV1 पहले ही efficient और open video format की दिशा में एक बड़ी छलांग था, और AV2 का भी लंबे समय से इंतज़ार था
    chips और hardware में इसके implement होने और efficient, तेज hardware encoding·decoding का उपयोग होने में समय लगेगा, लेकिन storage की बढ़ती कीमतों और chip crisis को देखते हुए लगभग 25% efficiency improvement बहुत आशाजनक लगती है

  • Dav2d उतना अच्छा नहीं सुनाई देता। उससे पहले उम्मीद है कि repository name पर अच्छे wordplay वाला कोई व्यक्ति योगदान दे दे
    avi2ude? av2go?

    • rav2d ठीक-ठाक लगता है — https://github.com/stukenov/rav2d. यह एक Rust port है, और rav1d→dav1d जैसी vibe देता है
    • av2 के लिए अच्छा नाम ढूँढना मुश्किल था
      फ़्रेंच में यह d2vid, यानी Deuvid बनता है
  • उम्मीद है कि कोई काफ़ी तेज encoder आएगा। AV1 का reference encoder भी बहुत अच्छा नहीं था, और यहाँ भी शायद वही स्थिति है
    लेकिन जैसे ही SVT-AV2 जैसा कुछ आता है, मैं काफ़ी संतुष्ट हो जाऊँगा