唐述 周广义 谢显中 赵瑜 杨书丽

唐述, 周广义, 谢显中, 赵瑜, 杨书丽. 一种快速的多尺度多输入编码树单元互补分类网络[J]. 电子与信息学报, 2024, 46(9): 3646-3653. doi: 10.11999/JEIT240223
TANG Shu, ZHOU Guangyi, XIE Xianzhong, ZHAO Yu, YANG Shuli. A Multi-scale-multi-input Complementation Classification Network for Fast Coding Tree Unit Partition[J]. Journal of Electronics & Information Technology, 2024, 46(9): 3646-3653. doi: 10.11999/JEIT240223
doi: 10.11999/JEIT240223
基金项目: 国家自然科学基金(61601070),重庆市自然科学基金面上项目(CSTB2023NSCQ-MSX0680),重庆市教育委员会科学技术研究重大项目(KJZD-M202300101),重庆邮电大学博士研究生创新人才项目(BYJS202217)







    唐述 tangshu@cqupt.edu.cn

  • 中图分类号: TN939.1; TP391.4

A Multi-scale-multi-input Complementation Classification Network for Fast Coding Tree Unit Partition

Funds: The National Natural Science Foundation of China (61601070), Chongqing Natural Science Foundation General Project (CSTB2023NSCQ-MSX0680), The Major Project of Science and Technology Research of Chongqing Education Commission (KJZD-M202300101), The Innovative Talents Project for Doctoral students of Chongqing University of Posts and Telecommunications (BYJS202217)
  • 摘要: 深度神经网络(DNN)已被广泛应用到高效视频编码(HEVC)编码树单元(CTU)的深度划分中,显著降低了编码复杂度。然而现有的基于DNN的CTU深度划分方法却忽略了不同尺度编码单元(CU)间的特征相关性和存在着分类错误累积等缺陷。基于此,该文提出一种多尺度多输入的互补分类网络(MCCN)来实现更高效且更准确的HEVC帧内CTU深度划分。首先,提出一种多尺度多输入的卷积神经网络(MMCNN),通过融合不同尺度CU的特征来建立CU间的关联,进一步提升网络的表达能力。然后,提出一种互补的分类策略(CCS),通过结合二分类和三分类,并采用投票机制来决定CTU中每个CU的最终深度值,有效避免了现有方法中存在的错误累积效应,实现了更准确的CTU深度划分。大量的实验结果表明,该文所提MCCN能够更大程度降低HEVC编码的复杂度,同时实现更准确的CTU深度划分: 仅以增加3.18%的平均增量比特率(BD-BR)为代价,降低了71.49%的平均编码复杂度。同时,预测32×32 CU和16×16 CU的深度准确率分别提升了0.65%~0.93%和2.14%~9.27%。
  • 图  1  本文所提CCS

    图  2  二分类MMCNN

    图  3  三分类MMCNN

    表  1  MMCNN的有效性消融实验(%)

    模型 平均BD-BR 平均ΔT
    MCCN 3.18 71.49
    MCCN-NoQP 9.80 58.60
    MCCN-OneScale 11.50 64.30
    表  2  消融实验:不同大小CU的深度划分平均准确率比较(%)

    64 × 64 CU 90.30 88.05
    32× 32 CU 87.55 86.51
    16× 16 CU 89.69 85.71
    表  3  MCCN和MCCN-SBC的平均BD-BR和平均ΔT比较(%)

    模型 平均BD-BR 平均ΔT
    MCCN 3.18 71.49
    MCCN-SBCS 7.86 67.00
    表  4  平均准确率比较(其中最好的性能已加粗标记)(%)

    本文 文献[12] 文献[15]
    64 × 64 CU 90.30 90.98 91.18
    32× 32 CU 87.55 86.62 86.90
    16×16 CU 89.69 80.42 87.55
    表  5  所有方法在JCT-VC标准视频测试集上的平均BD-BR和平均ΔT比较(其中最好的性能已加粗标记)(%)

