تاریخچه کامل کدک ها

یک ارتقای آرام با پیامدهایی نه چندان آرام

اگر اینترنت یک آلبوم عکس خانوادگی داشت ، قطعاً اچ.۲۶۴ (H.264) روی جلد آن بود . برای بیش از یک دهه ، اچ.۲۶۴ پایه و اساس همه چیز بوده است . از استریم‌های یوتیوب (YouTube) گرفته تا دوربین‌ های مداربسته ، تماس‌ های تصویری و ویدیو های مرورگرها .

این فرمت به این دلیل به گزینه پیش‌فرض تبدیل شد که به سادگی ، همه‌ جا کار می‌کرد . چون هر دستگاهی در کره زمین ، دارای یک دیکدر سخت‌ افزاری (Hardware Decoder) برای آن است .
اما زمان گذشت ، رزولوشن‌ ها افزایش یافتند و مردم به خرید تلویزیون‌ های 4K رغبت بیشتری نشان دادند ، بدون آنکه بتوانند تفاوت چندانی با تصویر یک فول اچ‌ دی (1080p) خوب تشخیص دهند . در نتیجه ، مهندسان همچنان یک سوال را تکرار می‌کردند : « آیا می‌توانیم ویدیو را حتی بهتر فشرده‌ سازی کنیم ؟ » و این گونه شد که به اچ.۲۶۵ (H.265/HEVC) و اچ.۲۶۶ (H.266/VVC) رسیدیم . دو کدک (Codec) بسیار کارآمد و بلند پرواز که وعده بهبود های چشمگیری را می‌دهند .

اچ.۲۶۴ : قابل اعتمادِ قدیمی

اچ.۲۶۴ سلطه خود بر بازار را با سه ویژگی اولیه به دست آورد :

  • بازدهی معقول
  • پشتیبانی سخت‌ افزاری در همه‌ جا
  • یک مدل لایسنس ( Licensing Model ) که اگرچه رایگان نبود ، اما حداقل قابل پیش‌بینی بود .

از نظر فنی ، اچ.۲۶۴ از ماکروبلاک‌ های ( Macroblock ) ۱۶×۱۶ پیکسلی استفاده می‌کند .

در زمان خودش ، این یک دستاورد بزرگ بود و این امکان را فراهم می‌کرد که فشرده‌سازی ( Compression ) مناسبی داشته باشیم و در عین حال ، فرآیند دیکد ( Decode ) به اندازه کافی برای سی‌ پی‌ یو های موبایل اولیه و گیرنده‌ های تلویزیونی ( Set-top Box ) ساده بماند .
در دنیای مرورگرها ، اچ.۲۶۴ به «دست دادن جهانی» تبدیل شد .

کروم ( Chrome ) ، فایرفاکس ( Firefox ) ، سافاری ( Safari ) همگی از آن پشتیبانی کردند چون سخت‌ افزارش از قبل وجود داشت و نیازی نبود بخش حقوقی شرکت‌ ها عرق سردی بریزند .
اما هیچ چیز تا ابد پایدار نمی‌ماند . به ویژه وقتی رزولوشن ویدیوها مدام دو برابر می‌شود .

اچ.۲۶۵ (HEVC) : موفق اما با درام لایسنس

 اچ.ای.وی.سی (HEVC) مانند یک بنیان‌گذار استارتاپ در دره سیلیکون ( Silicon Valley ) حاضر شد .

مواردی که اچ.وی.سی را سر زبان ها آورد :

۱. ساختار های بلوکی بزرگ تر و هوشمند تر :
اچ.۲۶۵ ماکروبلاک‌ های قدیمی ۱۶×۱۶ را کنار گذاشت و واحد های درختی کدینگ ( Coding Tree Units یا CTUs ) تا اندازه ۶۴×۶۴ پیکسل را معرفی کرد .
این یک تغییر بزرگ است . بلوک‌ های بزرگتر = بیت‌ های سربار ( Overhead Bits ) کمتر = بازدهی فشرده‌ سازی به مراتب بالاتر ، به ویژه برای نواحی یکدست ، آسمان ، دیوارها و صحنه‌ های ثابت نظارتی .
۲. پارتیشن‌ بندی انعطاف‌ پذیر تر :
هر واحد درختی کدینگ ۶۴×۶۴ می‌تواند به صورت بازگشتی به بلوک‌ های کوچک تر تقسیم شود . حتی تا اندازه ۴×۴ .

این مانند ارتقاء از لگو (LEGO) به نانو ربات‌ ها است . انکدر (Encoder) می‌تواند اندازه بلوک را با محتوا تطبیق دهد :

  • بلوک‌ های بزرگ برای نواحی آرام
  • بلوک‌ های ریز نزدیک لبه‌ ها ، حرکت ، چهره‌ ها ، پلاک خودرو ها

۳. پیش‌بینی حرکت بهتر :
جهت‌ های بیشتر ، حالت‌ های پیش‌ بینی بیشتر و جبران سازی (Compensation) دقیق‌ تر .
۴. دیکد موازی :
اچ.ای.وی.سی پردازش موازی موجی (Wavefront Parallel Processing یا WPP) را معرفی کرد که به سطرهای مختلف بلوک‌ ها اجازه می‌دهد به طور همزمان دیکد شوند . در نهایت هم از قابلیت سی‌ پی‌ یو های چند هسته‌ای (Multi-core CPUs) بهره می برد .
۵. دسترسی تصادفی پاک (Clean Random Access) :
این یک عبارت فانتزی برای گفتن این است که : شما می‌توانید سریع‌ تر به یک استریم (Stream) بپرید بدون اینکه نیاز باشد نیمی از صحنه قبلی را دیکد کنید . برای سیستم های نظارتی و پایش تصویری ، این مانند طلا است . اپراتورها به دسترسی فوری نیاز دارند ، نه یک انتظار ۲ ثانیه‌ای .
به طور خلاصه : اچ.ای.وی.سی واقعاً برتر از اچ.۲۶۴ است .
اما این بخشی است که روی بروشور ننوشتند :
اچ.ای.وی.سی دارای سه پتنت پول (Patent Pool) رقابتی است .
که یعنی برای سازندگان سخت‌افزار ، آزاردهنده و برای فروشندگان مرورگرهای متن‌باز (Open-source) این یک بن‌ بست است .
سافاری از اچ.ای.وی.سی پشتیبانی می‌کند چون اپل در هر حال هزینه سخت‌ افزار دیکدینگ را می‌پردازد .
مایکروسافت اج (Microsoft Edge) هم از طریق دیکدر های فروشگاه ویندوز (Windows Store) این کار را دنبال می‌کند .
کروم و فایرفاکس نگاهی به هزارتوی لایسنس انداختند و زیر لب گفتند «نه» .

اچ.۲۶۶ (VVC): یک شگفتی فنی گرفتار در مباحث حقوقی

درست زمانی که اچ.ای.وی.سی داشت جا می‌افتاد ، مهندسان چیزی حتی پیشرفته‌ تر خلق کردند اچ.۲۶۶ – وی.وی.سی (VVC).

شما آن را مانند اچ.ای.وی.سی تصور کنید که توربو charged شده است .

مواردی که وی.وی.سی بهتر انجام می‌ دهد :

  • تا ۵۰٪ فشرده‌سازی بهتر نسبت به اچ.ای.وی.سی
  • ایده‌آل برای ویدیو های ۴کی، ۸کی (8K)، ۱۲کی (12K)، ۳۶۰ درجه ، واقعیت مجازی/واقعیت افزوده (VR/AR)
  • پارتیشن‌ بندی بلوکی فوق‌ العاده انعطاف‌ پذیر
  • پیش‌ بینی درون‌ قالبی (Intra Prediction) پیشرفته
  • پیش‌ بینی بین‌ قالبی (Inter Prediction) بهبود یافته
  • مدیریت بهتر حرکت سریع
  • موازی‌سازی بیشتر

ساختار بلوکی حتی impression تر

وی.وی.سی مفهوم واحد درختی کدینگ ۶۴×۶۴ را حفظ می‌کند ، اما پارتیشن‌ بندی را با یک ساختار درختی چهار تایی (Quadtree) + درختی چند نوعی (Multi-type Tree) گسترش می‌دهد .

ترجمه : انکدر بلوک‌ ها را با الگو هایی به طرز مسخره‌ ای انعطاف‌ پذیر تقسیم می‌کند . به صورت افقی ، عمودی ، مورب ، نامتقارن و با دقتی جراحی شده ، شکل‌ ها را برای تطبیق با جزئیات ریز یا حرکت‌های آشفته ، تراش می‌دهد .
این برای فشرده‌ سازی فوق‌ العاده است .
اما مهندسی شگفت‌انگیز لزوماً به معنای پذیرش در دنیای واقعی نیست . به ویژه وقتی که داستان لایسنس تکرار می‌شود .
وی.وی.سی با پتنت پول جدید خودش می‌آید و حدس بزنید چه کسی آن را اداره می‌کند؟
بله ، همان افرادی که پشت پتنت پول پیچیده‌ تر اچ.ای.وی.سی بودند .
فروشندگان مرورگر ها یک بار دیگر عقب نشینی کردند .
تا امروز ، هیچ مرورگر اصلی از اچ.۲۶۶ پشتیبانی نمی‌کند و به نظر نمی‌رسد عجله‌ ای هم داشته باشند .

چرا مرورگر ها می‌گویند «ممنون، فعلاً نه متشکرم» ؟

وی.وی.سی مفهوم واحد درختی کدینگ ۶۴×۶۴ را حفظ می‌کند ، اما پارتیشن‌ بندی را با یک ساختار درختی چهار تایی (Quadtree) + درختی چند نوعی (Multi-type Tree) گسترش می‌دهد .

ترجمه : انکدر بلوک‌ ها را با الگو هایی به طرز مسخره‌ ای انعطاف‌ پذیر تقسیم می‌کند . به صورت افقی ، عمودی ، مورب ، نامتقارن و با دقتی جراحی شده ، شکل‌ ها را برای تطبیق با جزئیات ریز یا حرکت‌های آشفته ، تراش می‌دهد .
این برای فشرده‌ سازی فوق‌ العاده است .
اما مهندسی شگفت‌انگیز لزوماً به معنای پذیرش در دنیای واقعی نیست . به ویژه وقتی که داستان لایسنس تکرار می‌شود .
وی.وی.سی با پتنت پول جدید خودش می‌آید و حدس بزنید چه کسی آن را اداره می‌کند؟
بله ، همان افرادی که پشت پتنت پول پیچیده‌ تر اچ.ای.وی.سی بودند .
فروشندگان مرورگر ها یک بار دیگر عقب نشینی کردند .
تا امروز ، هیچ مرورگر اصلی از اچ.۲۶۶ پشتیبانی نمی‌کند و به نظر نمی‌رسد عجله‌ ای هم داشته باشند .

منطق به طرز دردناکی ساده است :

  • مرورگر ها رایگان هستند .
  • مرورگر ها روی میلیاردها دستگاه اجرا می‌شوند .
  • مرورگر ها نمی‌توانند کدک‌ های دارای حق امتیاز (Patented Codecs) را بدون پوشش لایسنس تضمین شده ، جاسازی کنند .
  • اچ.ای.وی.سی و وی.وی.سی گران و fragmented هستند .
  • پشتیبانی از آن‌ ها می‌تواند فروشندگان مرورگرها را در معرض مسئولیت حقوقی عظیمی قرار دهد .

و در طرف دیگر ؟
اِی.وی۱ (AV1) وجود دارد .
بدون حق امتیاز (Royalty-free).
پشتیبانی شده توسط گوگل ، نتفلیکس (Netflix) ، آمازون (Amazon) ، اپل ، مایکروسافت ، موزیلا (Mozilla) .
پشتیبانی شده توسط جی‌ پی‌ یو های (GPU) مدرن .
به طور فزاینده‌ ای کارآمد .
پس ، مرورگرها در حال انتخاب کدکی هستند که آن‌ها را به دادگاه نکشاند .

در دنیای دوربین‌های مداربسته

سیستم‌های امنیتی با قوانین متفاوتی بازی می‌کنند .
سازندگان ، سخت‌افزار ، نرم‌افزار و محیط را کنترل می‌کنند ، یک حلقه بسته .

آن‌ ها می‌توانند مستقیم کدک‌ها را لایسنس کنند بدون نگرانی از میلیاردها کاربر یا تعهدات متن‌باز .
در دنیای سیستم های نظارتی :

  • اچ.۲۶۵ از قبل متداول است .
  • اچ.۲۶۶ در حال ظهور است .
  • صرفه‌جویی در فضای ذخیره‌سازی مهم است .
  • محدودیت‌های پهنای باند (Bandwidth) مهم است .
  • پیچیدگی حقوقی چیزی است که فروشندگان واقعاً می‌توانند مدیریتش کنند .

اما حتی در آنجا نیز مسیر ارتقاء به هیچ وجه هموار نیست . زیرا :

  1. دوربین‌ های قدیمی را نمی‌ توان برای پشتیبانی از کدک‌های جدید به‌ روز رسانی کرد .
  2. سیستم روی یک چیپ‌ های (SoC) ارزان قیمت به زودی اچ.۲۶۴ را پردازش می‌کنند ، چه برسد به اچ.ای.وی.سی .
  3. وی.وی.سی قدرت پردازشی به مراتب بیشتری می‌طلبد .
  4. پلتفرم‌ های سیستم مدیریت ویدیو (VMS) باید بخش‌ های عمده‌ ای از خطوط رسانه‌ای (Media Pipelines) خود را باز نویسی کنند .

بنابراین ایده «همگی به اچ.۲۶۶ کوچ کنند» به طور محکمی در آینده باقی مانده است .

واقعیت عملی

 سفر از اچ.۲۶۴ به اچ.۲۶۵ و اچ.۲۶۶ فقط مربوط به الگوریتم‌های هوشمندتر یا بلوک‌ های کدینگ بزرگتر نیست . این یک یادآوری است که در فناوری، بهترین طراحی همیشه برنده نمی‌شود . آن طراحی که کمترین موانع حقوقی را دارد ، اغلب برنده است .

برای وب باز (Open Web) :

  • اچ.۲۶۴ هنوز پایه و اساس است .
  • AV۱ مسیر روشن پیش رو است .
  • اچ.وی.سی و وی.وی.سی به سادگی درگیر مسائل لایسنس هستند .

برای اکوسیستم‌ های بسته مانند سی‌سی‌تی‌وی (CCTV) :

  • اچ.۲۶۵ امروز منطقی است
  • وی.وی.سی بالاخره روزی منطقی خواهد شد
  • اما این انتقال پرهزینه، پیچیده و کند خواهد بود .
 نیاز به مشاوره دارید ؟ 
با ما تماس بگیرید