杨春玲 梁梓文

杨春玲, 梁梓文. 静态与动态域先验增强的两阶段视频压缩感知重构网络[J]. 电子与信息学报, 2024, 46(11): 4247-4258. doi: 10.11999/JEIT240295
YANG Chunling, LIANG Ziwen. Static and Dynamic-domain Prior Enhancement Two-stage Video Compressed Sensing Reconstruction Network[J]. Journal of Electronics & Information Technology, 2024, 46(11): 4247-4258. doi: 10.11999/JEIT240295
基金项目: 广东省自然科学基金(2019A1515011949)




    杨春玲 eeclyang@scut.edu.cn

  • 中图分类号: TN919.8; TN911.7

Static and Dynamic-domain Prior Enhancement Two-stage Video Compressed Sensing Reconstruction Network

Funds: The Natural Science Foundation of Guangdong Province (2019A1515011949)
  • 摘要: 视频压缩感知重构属于高度欠定问题,初始重构质量低与运动估计方式单一限制了帧间相关性的有效建模。为改善视频重构性能,该文提出静态与动态域先验增强两阶段重构网络(SDPETs-Net)。首先,提出利用参考帧测量值重构2阶静态域残差的策略,并设计相应的静态域先验增强网络(SPE-Net),为动态域先验建模提供可靠基础。其次,设计塔式可变形卷积联合注意力搜索网络(PDCA-Net),通过结合可变形卷积与注意力机制的优势,并构建塔式级联结构,有效地建模并利用动态域先验知识。最后,多特征融合残差重构网络(MFRR-Net)从多尺度提取并融合各特征的关键信息以重构残差,缓解两阶段耦合导致不稳定的模型训练,并抑制特征的退化。实验结果表明,在UCF101测试集下,与具有代表性的两阶段网络JDR-TAFA-Net相比,峰值信噪比(PSNR)平均提升3.34 dB,与近期的多阶段网络DMIGAN相比,平均提升0.79 dB。
  • 图  1  SDPETs-Net整体架构

    图  2  两级多维残差补充阶段实现细节

    图  3  PDCA-Net网络结构

    图  4  预对齐与细化对齐

    图  5  不同算法及模型重构视觉效果对比(Soccer序列第12帧)

    图  6  不同模型重构视觉效果对比(REDS4-000序列第36帧)

    表  1  UCF101测试集重构性能对比PSNR(dB)/SSIM

    $ {r}_{\mathrm{n}\mathrm{k}} $CSVideoNetSTM-NetImr-NetJDRTAFA-NetDUMHANDMIGAN本文
    $ 0.037 $26.87/0.8132.50/0.9333.40/—33.14/0.9435.37/—35.86/—36.36/0.96
    $ 0.018 $25.09/0.7731.14/0.9131.90/—31.63/0.9133.70/—34.23/—35.01/0.95
    $ 0.009 $24.23/0.7429.98/0.8930.51/—30.33/0.8932.11/—32.65/—33.75/0.94
    表  2  QCIF序列重构性能对比PSNR(dB)($ {r}_{\mathrm{k}}=0.5 $,$ \mathrm{G}\mathrm{O}\mathrm{P}=8 $)

    $ {r}_{\mathrm{n}\mathrm{k}} $ 算法
    视频序列 平均值
    Silent Ice Foreman Coastguard Soccer Mobile
    0.01 RRS 21.25 20.72 18.51 21.16 21.42 15.24 19.72
    SSIM-InterF-GSR 24.77 24.65 26.86 25.08 23.39 21.92 24.45
    VCSNet-2 31.94 25.77 26.07 25.66 24.62 21.42 25.91
    ImrNet 35.30 29.25 31.58 28.94 27.10 25.02 29.53
    DUMHAN 37.25 31.69 34.46 31.63 28.37 29.28 32.11
    本文SDPETs-Net 38.05 32.92 36.05 32.76 29.50 30.35 33.27
    0.05 RRS 25.76 26.15 26.84 22.66 26.80 16.68 24.15
    SSIM-InterF-GSR 33.68 28.81 33.18 28.09 27.65 22.99 29.07
    VCSNet-2 34.52 29.51 29.75 27.01 28.62 22.79 28.70
    ImrNet 38.07 33.76 36.03 30.80 31.81 27.55 33.00
    DUMHAN 40.42 36.58 39.44 33.63 33.74 31.61 35.90
    本文SDPETs-Net 41.09 37.98 40.82 34.31 34.85 32.36 36.90
    0.1 RRS 33.95 31.09 35.17 27.34 29.74 20.00 29.55
    SSIM-InterF-GSR 35.09 31.73 35.75 30.24 30.31 24.35 31.25
    VCSNet-2 34.92 30.95 31.14 28.01 30.51 23.62 29.86
    ImrNet 39.17 35.90 37.37 31.44 34.24 28.19 34.39
    DUMHAN 41.73 38.66 41.68 34.73 36.40 32.48 37.61
    本文SDPETs-Net 42.71 40.10 42.97 35.22 37.52 33.07 38.60
    表  3  REDS4序列重构性能对比PSNR(dB)/SSIM

    $ {r}_{\mathrm{n}\mathrm{k}} $ 序列 VCSNet-2 ImrNet STM-Net DUMHAN 本文SDPETs-Net
    0.01 000 23.24/— 25.71/0.67 26.45/0.73 27.74/0.77 29.44/0.85
    011 24.19/— 25.93/0.66 26.89/0.71 26.72/0.70 27.77/0.74
    015 26.85/— 30.01/0.81 30.67/0.84 31.02/0.85 32.66/0.89
    020 23.34/— 25.15/0.66 25.98/0.71 25.97/0.70 26.99/0.75
    0.1 000 27.55/— 29.09/0.85 30.69/0.90 31.80/0.91 32.82/0.94
    011 29.65/— 32.29/0.89 32.82/0.90 33.52/0.90 34.36/0.92
    015 32.34/— 36.33/0.94 37.06/0.95 38.00/0.95 39.07/0.96
    020 28.88/— 31.23/0.90 31.65/0.91 32.17/0.91 33.16/0.93
    表  4  不同模型的空间与重构时间(GPU)与重构精度(PSNR(dB)/SSIM)对比

    模型 参数量(M) 平均单帧重构时间(GPU)(s) 平均重构精度(PSNR(dB)/SSIM)
    ImrNet 8.69 0.03 31.94/—
    STM-Net 9.20 0.03 31.21/0.91
    JDR-TAFA-Net 12.41 0.04 31.70/0.91
    本文SDPETs-Net 7.44 0.04 35.04/0.95
    本文SDPETs-Net 7.44 0.02(GOP并行) 35.04/0.95
    表  5  静态域先验增强阶段的消融研究(PSNR(dB)/SSIM)

    模型 设置 QCIF序列 平均值
    SR MG Silent Ice Foreman Coastguard Soccer Mobile
    基础 36.71/0.97 31.42/0.94 34.04/0.94 31.19/0.88 28.20/0.76 27.82/0.92 31.56/0.90
    1 × 36.32/0.96 31.09/0.94 33.14/0.92 30.14/0.85 27.99/0.74 26.78/0.90 30.91/0.89
    2 × × 26.65/0.61 26.21/0.80 24.90/0.63 24.06/0.51 26.77/0.67 19.42/0.35 24.67/0.60
    表  6  PDCA-Net消融实验对比(PSNR(dB)/SSIM)

