孙钰 严宇 崔剑 熊高剑 刘建华

SUN Yu, YAN Yu, CUI Jian, XIONG Gaojian, LIU Jianhua. Review of Deep Gradient Inversion Attacks and Defenses in Federated Learning[J]. Journal of Electronics & Information Technology, 2024, 46(2): 428-442. doi: 10.11999/JEIT230541
doi: 10.11999/JEIT230541
基金项目: 国家自然科学基金(32071775)







    崔剑 cuijianw@buaa.edu.cn

  • 中图分类号: TN918; TP301

Review of Deep Gradient Inversion Attacks and Defenses in Federated Learning

Funds: The National Natural Science Foundation of China (32071775)
  • 摘要: 联邦学习作为一种“保留数据所有权,释放数据使用权”的分布式机器学习方法,打破了阻碍大数据建模的数据孤岛。然而,联邦学习在训练过程中只交换梯度而不交换训练数据的特点并不能保证用户训练数据的机密性。近年来新型的深度梯度反演攻击表明,敌手可从共享梯度中重建用户的私有训练数据,从而对联邦学习的私密性产生了严重威胁。随着梯度反演技术的演进,敌手从深层网络恢复大批量原始数据的能力不断增强,甚至对加密梯度的隐私保护联邦学习(PPFL)发起了挑战。而有效的针对性防御方法主要基于扰动变换,旨在混淆梯度、输入或特征以隐藏敏感信息。该文首先指出了隐私保护联邦学习的梯度反演漏洞,并给出了梯度反演威胁模型。之后从攻击范式、攻击能力、攻击对象3个角度对深度梯度反演攻击进行详细梳理。随后将基于扰动变换的防御方法依据扰动对象的不同分为梯度扰动、输入扰动、特征扰动3类,并对各类方法中的代表性工作进行分析介绍。最后,对未来研究工作进行展望。
  • 图  1  梯度反演威胁模型

    图  2  梯度反演攻击分类

    图  3  基于迭代优化的典型数据重建方法对大批量图像数据的反演效果

    表  1  梯度反演攻击总结

    攻击方法 攻击范式 攻击能力 攻击对象 数据类型 前提假设 特点 不足
    DLG[20] 迭代优化 被动 数据重建+
    采用欧氏距离作为梯度匹配目标;同时优化数据与标签。 仅适用于小批量低分辨率图像,重建效果对模型权重初始化方法、训练阶段敏感。
    SAPAG[31] 迭代优化 被动 数据重建 图像 采用基于加权高斯核的梯度匹配目标。 仅适用于小批量低分辨率图像。
    CPL[32] 迭代优化 被动 数据重建 图像 引入标签正则化项。 仅适用于小批量低分辨率图像。
    IG[33] 迭代优化 被动 数据重建 图像 标签已知。 基于余弦相似度的梯度匹配目标,引入全变分正则项,可重建高分辨率图像。 仅适用于小批量图像。
    GI[34] 解析+
    被动 标签恢复
    采用非负激活函数,训练批次中无重复标签样本;已知BN统计信息。 引入保真度正则和组一致性正则。 无法恢复重复标签样本的具体数量;BN统计信息已知的假设太强。
    GIAS[36] 迭代优化 被动 数据重建 图像 预训练GAN模型,标签已知。 依次在GAN隐空间和参数空间上优化。 重建图像失真。
    GGL[37] 迭代优化 被动 数据重建 图像 预训练GAN模型,标签已知。 评估多种防御方法下的梯度反演效果。 重建图像失真。
    HCGLA[39] 迭代优化 被动 数据重建 图像 预训练GAN模型、去噪模型。 对稀疏至0.1%的梯度成功反演。 仅针对单样本。
    TAG[41] 迭代优化 被动 数据重建 文本 L2、L1范数结合的梯度匹配目标,在嵌入空间上迭代优化。 仅针对单文本。
    LAMP[42] 迭代优化 被动 数据重建 文本 标签已知,辅助语言模型(如GPT-2)。 交替进行嵌入空间上的连续优化和文本顺序上的离散优化。 仅适用于小批量文本。
    Li等人[43] 迭代优化 被动 数据重建 语音 首个两阶段语音波形重建方法。 仅针对单样本。
    TabLeak[44] 迭代优化 被动 数据重建 表格 首个表格数据重建方法。
    解析 被动 数据重建 图像 针对全连接网络。 利用全连接网络输入与梯度的线性关系。 仅针对单样本且依赖梯度的完整性。
    解析 被动 数据重建 图像 针对全连接网络、卷积神经网络。 通过求解梯度约束、权重约束方程组重建输入。 仅针对单样本且依赖梯度的完整性。
    CPA[47] 解析+
    被动 数据重建 图像 针对全连接网络、卷积神经网络。 将全连接网络梯度反演建模为盲源分离问题。 批次大小需小于首个全连接层神经元数,依赖梯度的完整性。
    FILM[48] 解析 被动 数据重建 文本 从梯度中恢复所有词,再基于波束搜索和重排序重建句子。 依赖梯度的完整性。
    解析 主动 聚合梯度分解 固定模型权重。 将聚合梯度的分解问题表示为约束二元矩阵分解问题。 依赖梯度的完整性,易被用户检测出。
    解析 主动 数据重建 图像 篡改模型权重,针对ReLU激活的全连接网络。 通过恶意权重暴露更多的独占神经元。 依赖梯度完整性,攻击成功率提升有限。
    解析 主动 平均梯度退化 篡改模型最后一个分类层的权重。 通过钓鱼策略使平均梯度退化至单个目标样本产生的梯度 一次攻击仅能恢复一个样本,易被用户检测出。
    解析 主动 聚合梯度退化 篡改模型权重,采用ReLU激活函数。 通过恶意权重使聚合梯度退化至单个目标用户产生的梯度。 易被用户检测出。
    解析 主动 数据重建 图像 篡改模型结构(插入印记模块)及权重。 通过恶意模型权重分离线性层梯度。 依赖梯度的完整性,易被用户检测出。
    解析 主动 数据重建 图像 篡改模型结构及权重。 向印记模块前插入卷积层以分离不同用户在印记模块的梯度。 依赖梯度的完整性,易被用户检测出。
    NEA[55] 解析+
    主动 数据重建 图像 篡改用户数据预处理算法,采用ReLU激活函数。 为全连接网络的输入与梯度建立线性方程组。 依赖梯度的完整性,易被用户检测出。
    解析 主动 数据重建 文本 篡改模型权重。 通过恶意模型权重禁用注意力层,分离线性层梯度。 依赖梯度的完整性,易被用户检测出。
    iDLG[57] 解析 被动 标签恢复 标签 根据最后一层的梯度
    RLG[58] 解析 被动 标签恢复 标签 批次大小小于模型
    iLRG[59] 解析 被动 标签恢复 标签 将标签恢复粒度提升至实例数目,可恢复相同标签样本的具体数量 训练后期的恢复精度下降。
    表  2  梯度反演防御方法总结

    防御方法 扰动对象 特点 模型准确率损失 不足
    梯度加噪[20] 梯度扰动 直接向梯度注入固定方差的高斯或拉普拉斯噪声。 –30.5%(CIFAR100) 难以在隐私性与模型准确率间取得平衡。
    Fed-CDP[61] 梯度扰动 逐样本的客户端侧差分隐私。 –6.2%(MNIST)
    DP-dynS[62] 梯度扰动 动态隐私参数的差分隐私。 –6.6%(CIFAR10)
    LRP[63] 梯度扰动 根据梯度随输入变化的敏感度向梯度注入针对性噪声。 –1.58%(CIFAR10)
    8比特梯度量化[20] 梯度扰动 将高精度梯度量化至低精度。 –22.6%(CIFAR100)
    InstaHide[64] 输入扰动 对训练图像进行实例编码。 –5.8%(CIFAR100) 已无法抵抗攻击能力不断增强的梯度反演。
    ATS[65] 输入扰动 搜索隐私性强、对模型准确率影响小的数据增强策略。 +1.04%(CIFAR100)
    Soteria[40] 特征扰动 对网络中间特征进行扰动。 –0.5%(CIFAR100)
    TextHide[68] 特征扰动 对训练文本在网络的中间特征实例编码。 –1.9%(GLUE)
    PRECODE[69] 特征扰动 向网络中插入隐私增强模块。 –2.2%(CIFAR10)
    表  3  典型深度梯度反演攻防能力矩阵

    防御 DLG[20] IG[33] R-GAP[45] GI[34] NEA[55] GGL[37] BFGL[70] HCGLA[39] Carlini
图(3) / 表(3)
  • 收稿日期:  2023-06-01
  • 修回日期:  2023-12-01
  • 网络出版日期:  2023-12-23
  刊出日期:  2024-02-29



