赵宇 陈思光

赵宇, 陈思光. 融合通道个性标准化的本地自适应联邦学习研究[J]. 电子与信息学报, 2024, 46(8): 3174-3183. doi: 10.11999/JEIT231165
ZHAO Yu, CHEN Siguang. Local Adaptive Federated Learning with Channel Personalized Normalization[J]. Journal of Electronics & Information Technology, 2024, 46(8): 3174-3183. doi: 10.11999/JEIT231165
doi: 10.11999/JEIT231165 cstr: 32379.14.JEIT231165
基金项目: 国家自然科学基金(61971235),江苏省“333高层次人才培养工程”和南邮“1311”人才计划




    陈思光 sgchen@njupt.edu.cn

  • 中图分类号: TN919; TP393

Local Adaptive Federated Learning with Channel Personalized Normalization

Funds: The National Natural Science Foundation of China (61971235), The 333 High-level Talents Training Project of Jiangsu Province, and the 1311 Talents Plan of NJUPT
  • 摘要: 为了缓解联邦学习(FL)中客户端之间由于完全重叠特征偏移所带来的数据异构问题影响,该文提出一种融合通道个性标准化的本地自适应联邦学习算法。具体地,构建了一个面向数据特征偏移的联邦学习模型,在训练开始之前先对客户端中的图像数据集进行一系列随机增强操作。其次,客户端分别按颜色通道单独计算数据集的均值和标准差,实现通道个性标准化。进一步地,设计本地自适应更新联邦学习算法,即自适应地聚合全局模型和本地模型以进行本地初始化,该聚合方法的独特之处在于既保留了客户端模型的个性化特征,同时又能从全局模型中捕获必要信息,以提升模型的泛化性能。最后,实验结果表明,该文所提算法与现有相关算法相比,收敛速度更快,准确率提高了3%~19%。
  • 图  1  自适应更新联邦学习模型

    图  2  融合通道个性标准化的本地自适应联邦学习框架

    图  3  通道个性标准化

    图  4  实验设置

    图  5  准确率变化曲线

    图  6  准确率变化曲线

    1  融合通道个性标准化的本地自适应联邦学习算法

        初始化全局模型${{\boldsymbol{\theta}} ^0}$;
        本地模型学习率$\alpha $;
        聚合权重学习率$\eta $;
        客户端数据采样率$s\% $;
     输出:训练后的本地模型${\boldsymbol{\theta}} _1^t,{\boldsymbol{\theta}} _2^t,\cdots,{\boldsymbol{\theta}} _N^t$以及全局模型${{\boldsymbol{\theta}} ^t}$.
     (1) BEGIN
     (2) 边缘服务器向所有客户端发送${{\boldsymbol{\theta}} ^0}$以初始化本地模型;
     (3) 所有客户端将聚合权重${\boldsymbol{W}}_i^p,\forall i \in \left[ N \right]$初始化为1
     (4) FOR $t$ IN 通信轮次$T$ DO
     (5)   服务器将${{\boldsymbol{\theta}} ^{t - 1}}$发送给所有客户端;
     (6)   FOR 所有客户端并行 DO
     (7)    客户端$i$采样$s\% $本地数据;
     (8)    客户端$i$对本地数据随机增强;
     (9)    客户端$i$基于式(3)通道个性标准化本地数据;
     (10)    IF $t = 2$ THEN
     (11)     WHILE ${\boldsymbol{W}}_i^p$不收敛 DO
     (12)      客户端$i$基于式(8)训练${\boldsymbol{W}}_i^p$;
     (13)    ELSE IF $t > 2$ THEN
     (14)     客户端$i$基于式(8)训练${\boldsymbol{W}}_i^p$;
     (15)    客户端$i$基于式(7)聚合出$\hat {\boldsymbol{\theta}} _i^t$用以本地训练;
     (16)    客户端$i$基于本地训练获得
          ${\boldsymbol{\theta}} _i^t \leftarrow \hat {\boldsymbol{\theta}} _i^t - \alpha \nabla \hat {\boldsymbol{\theta}} _i^tL\left( {\hat {\boldsymbol{\theta}} _i^t,{D_i};{{\boldsymbol{\theta}} ^{t - 1}}} \right)$;
     (17)    客户端$i$上传${\boldsymbol{\theta}} _i^t$给边缘服务器以聚合;
     (18)   END FOR
     (19)   服务器基于式(9)聚合全局模型${{\boldsymbol{\theta}} ^t}$;
     (20) END FOR
     (21) END
  • 收稿日期:  2023-10-26
  • 修回日期:  2024-01-24
  • 网络出版日期:  2024-03-04
  • 刊出日期:  2024-08-30


