任坤 李峥瑱 桂源泽 范春奇 栾衡

任坤, 李峥瑱, 桂源泽, 范春奇, 栾衡. 低分辨率随机遮挡人脸图像的超分辨率修复[J]. 电子与信息学报, 2024, 46(8): 3343-3352. doi: 10.11999/JEIT231262
REN Kun, LI Zhengzhen, GUI Yuanze, FAN Chunqi, LUAN Heng. Super-Resolution Inpainting of Low-resolution Randomly Occluded Face Images[J]. Journal of Electronics & Information Technology, 2024, 46(8): 3343-3352. doi: 10.11999/JEIT231262
doi: 10.11999/JEIT231262 cstr: 32379.14.JEIT231262
基金项目: 国家重点研发计划(2023YFC3904605)







    任坤 renkun@bjut.edu.cn

  • 中图分类号: TN911.73

Super-Resolution Inpainting of Low-resolution Randomly Occluded Face Images

Funds: The National Key Research and Development Project (2023YFC3904605)
  • 摘要: 针对低分辨率随机遮挡人脸图像,该文提出一种端到端的4倍超分辨率修复生成对抗网络(SRIGAN)。SRIGAN生成网络由编码器、特征补偿子网络和含有金字塔注意力模块的解码器构成;判别网络为改进的Patch判别网络。该网络通过特征补偿子网络和两阶段训练策略有效学习遮挡区域的缺失特征,通过在解码器中引入金字塔注意力模块和多尺度重建损失增强信息重构,从而实现低分辨率随机遮挡图像与4倍高分辨率完整图像的映射。同时,通过损失函数设计和改进Patch判别网络,确保网络训练的稳定性,提升生成网络性能。对比实验和模块验证实验验证了该算法的有效性。
  • 图  1  超分辨率修复生成对抗网络的总体框图

    图  2  超分辨修复生成网络的基本模块

    图  3  不同训练方法和阶段的视觉效果对比

    图  4  不同修复模块的输出视觉效果对比

    图  5  SRIGAN,SR-Inpainting和Inpainting-SR级联方法的重建结果图

    1  训练流程

         步骤1 数据预处理得到Igt, M, ILR, ${\boldsymbol{I}}' $(LR遮挡人脸图像);
         步骤2 输入ILR到En-De得到生成图像Igen
         步骤3 冻结生成网络,以损失函数LD优化判别网络;
         步骤4 冻结判别网络,以LG=λmulLmul+λadvLadv+λperLper+λstyleLstyle为损失函数优化生成网络;
         步骤5 当n= N1,循环1结束。
         步骤1 数据预处理得到Igt, M, ILR, ${\boldsymbol{I}}' $;
         步骤2 输入ILR到En得到特征p
         步骤3 输入${\boldsymbol{I}}' $ 到En-Fc得到特征q
         步骤4 以损失函数LFc优化Fc;
         步骤5 当n= N2,循环2结束。
    2  数据预处理

     步骤1 选取HR人脸图像真值Igt
         从训练集中随机取出m个HR图像$ {\boldsymbol{I}}_{{\text{gt}}}^{(1)},{\boldsymbol{I}}_{{\text{gt}}}^{(2)}, \cdots ,{\boldsymbol{I}}_{{\text{gt}}}^{(m)} $组成一个批量。
     步骤2 对Igt使用双线性插值下采样生成LR图像真值ILR
     步骤3 生成随机掩码M
         i=1,2,···, m迭代生成:
          若j=2,随机生成掩码位置坐标(a, b),掩码边长cd;生成对角线坐标为(a, b)和 (a+c, b+d) 的矩形掩码;
     步骤4 生成LR遮挡人脸图像I'(i)= I(i) ×M(i)
    表  1  不同训练方法和阶段性能比较

    PSNR(dB)↑21.207 024.860 825.295 9
    SSIM ↑0.724 70.890 30.906 4
    MAE ↓0.060 60.036 10.034 5
    表  2  各模块量化对比

    PSNR (dB)↑20.346 022.986 124.860 8
    SSIM↑0.685 50.821 80.890 3
    MAE↓0.068 50.047 90.036 1
    表  3  SR-Inpainting级联方法对比

    PSNR(dB)↑ 24.296 2 25.319 8 24.571 5 25.623 7 25.574 2 26.645 9 25.548 3 25.894 2 24.860 8
    SSIM ↑ 0.810 1 0.864 9 0.817 4 0.872 5 0.861 6 0.886 1 0.859 6 0.877 3 0.890 3
    MAE↓ 0.039 9 0.036 1 0.038 8 0.034 9 0.035 3 0.032 7 0.036 4 0.033 4 0.036 1
    表  4  Inpainting-SR级联方法对比

    PSNR(dB)↑ 24.393 9 22.838 3 22.212 3 24.487 5 25.807 2 26.598 6 23.892 4 24.623 5 24.860 8
    SSIM ↑ 0.841 3 0.810 6 0.790 3 0.844 9 0.819 1 0.831 5 0.771 0 0.782 7 0.890 3
    MAE↓ 0.045 7 0.053 9 0.057 8 0.045 3 0.036 7 0.034 2 0.053 1 0.047 5 0.036 1
