盛庆华 陶泽浩 黄小芳 赖昌材 黄晓峰 殷海兵 董哲康

SHENG Qinghua, TAO Zehao, HUANG Xiaofang, LAI Changcai, HUANG Xiaofeng, YIN Haibin, DONG Zhekang. A High-Throughput Hardware Design for AV1 Rough Mode Decision[J]. Journal of Electronics & Information Technology. doi: 10.11999/JEIT240823
doi: 10.11999/JEIT240823
基金项目: 国家重点研发计划(2023YFB4502804)









    黄小芳 20221016@hdu.edu.cn

  • 中图分类号: TN919.8

A High-Throughput Hardware Design for AV1 Rough Mode Decision

Funds: The National Key R&D Program of China (2023YFB4502804)
  • 摘要: 随着视频编码标准的不断更新迭代,开放媒体联盟(AOM)发布最新视频编码标准开放媒体视频编码标准(AV1)。其中,帧内编码技术采用更加丰富的预测模式来提高预测效率,预测种类从VP9中的10种扩展至61种。为了应对预测种类增加的变化并提高硬件的处理吞吐能力,该文提出基于全流水线结构的AV1粗模式决策硬件架构设计。在算法层面,以4×4块为最小处理单元,按照Z顺序对64×64编码树单元(CTU)中不同尺寸的预测单元(PUs)进行粗模式决策,同时采用基于1:1 PU的代价累加近似方法来完成1:2, 1:4, 2:1和4:1 PU的代价计算,以减少计算复杂度;在硬件层面,设计兼容4×4至32×32等多尺寸PU的粗模式决策电路,取代为不同尺寸PU单独设计电路的方法,有效减少逻辑资源的闲置。实验结果表明,在全帧内(AI)配置下,提出的改进算法相较于AV1标准算法平均节省了45.78%的时间,提高了1.94% BD-Rate。同时,提出的硬件架构设计能够在1057个时钟周期内完成64×64 CTU的粗模式决策,使用Synopsys公司的Design Compiler 2016工具及UMC 28 nm工艺库对硬件设计综合得到,该设计能够在432.7 MHz工作频率下实时处理8k@50.6fps的视频。
  • 图  1  RMD硬件总体架构设计

    图  2  硬件实现RMD流程图

    图  3  整体架构时空图

    图  4  4×4 PU参考像素填充情况

    图  5  输入顺序示意图

    图  6  方向性模式硬件设计

    图  7  DC模式硬件设计

    图  8  平滑模式硬件设计

    图  9  平滑模式权重PMCM硬件设计

    图  10  Paeth模式硬件设计

    图  11  4×4 PU的SATD代价计算硬件设计

    图  12  长度为8的乱序列双调排序示例

    图  13  输入序列长度为8的双调排序硬件设计

    表  1  改进算法与AV1标准算法的性能比较(%)

    A1(UHD 4K)2.2149.2
    A2(UHD 4K)1.7746.4
    表  2  本文改进算法与现有工作比较(%)

    文献 BD-Rate TS
    [33] 1.28 29.80
    [34] 7.41 50.19
    [35] 0.60 15.36
    本文 1.94 45.78
    表  3  基于ASIC实现的RMD相关硬件设计工作对比

    对比指标 文献[36] 文献[37] 文献[38] 文献[39] 本文
    工艺 TSMC 40 nm TSMC 40 nm TSMC 40 nm TSMC 40 nm UMC 28 nm
    门电路(Kgates) 455.8 821.8 584.8 128.5 1011.3
    工作频率(MHz) 1,296 1,902 1,296 648 432.7
    时钟周期(Cycle) 7104 7104 7104 7104 1057
    功耗(mW) 40.9 1613.3 4110.0 65.5 1891.6
    吞吐量 4k@60fps 4k@60fps 4k@60fps 4k@30fps 8k@50.6fps
    吞吐量/面积(px/gate) 1091.85 605.55 850.93 1936.44 1660.03
    非方向性预测 × × ×
    方向性预测 ×
    模式决策 × × × ×
