黄晓舸 吴雨航 尹宏博 梁承超 陈前斌

黄晓舸, 吴雨航, 尹宏博, 梁承超, 陈前斌. 车联网中基于有向无环图区块链的个性化联邦互蒸馏学习方法[J]. 电子与信息学报, 2024, 46(7): 2821-2830. doi: 10.11999/JEIT230976
HUANG Xiaoge, WU Yuhang, YIN Hongbo, LIANG Chengchao, CHEN Qianbin. Direct Acyclic Graph Blockchain-based Personalized Federated Mutual Distillation Learning in Internet of Vehicles[J]. Journal of Electronics & Information Technology, 2024, 46(7): 2821-2830. doi: 10.11999/JEIT230976
基金项目: 国家自然科学基金(62371082,62001076),重庆市自然科学基金(CSTB2023NSCQ-MSX0726,cstc2020jcyj-msxmX0878)




    梁承超:男,博士,教授,研究方向无线通信、空天地一体化网 络、(卫星)互联网架构与协议



    黄晓舸 huangxg@cqupt.edu.cn

  • 中图分类号: TN92

Direct Acyclic Graph Blockchain-based Personalized Federated Mutual Distillation Learning in Internet of Vehicles

Funds: The National Natural Science Foundation of China (62371082,62001076), The General Program of Natural Science Foundation of Chongqing (CSTB2023NSCQ-MSX0726,cstc2020jcyj-msxmX0878)
  • 摘要: 联邦学习(FL)作为一种分布式训练方法,在车联网(IoV)中得到了广泛应用。区别于传统机器学习,FL允许智能网联车辆(CAVs)通过共享模型而非原始数据来协同训练全局模型,从而保护CAV隐私和数据安全。为了提升联邦学习模型精度,降低通信开销,该文首先提出一种基于有向无环图(DAG)区块链和CAVs的IoV架构,分别负责全局模型共享和本地模型训练。其次,设计了一种基于DAG区块链的异步联邦互蒸馏学习(DAFML)算法在本地同时训练教师和学生模型,教师模型的专业级网络结构可取得更高精度,学生模型的轻量级网络结构可降低通信开销,并采用互蒸馏学习使教师模型和学生模型从互相转移的软标签中学习知识以更新模型。此外,为了进一步提高模型精度,基于全局训练轮次和模型精度设定个性化权值来调节互蒸馏占比。仿真结果表明,DAFML算法在模型精度和蒸馏比率方面优于其他比较算法。
  • 图  1  基于DAG区块链联邦互蒸馏学习架构

    图  2  不同算法在IID场景下全局训练轮次和模型精度关系

    图  3  不同算法在NonIID场景下全局训练轮次和模型精度关系

    图  4  LTM和LSM在互蒸馏方案下的增益

    图  5  不同算法在不同CNN层和蒸馏比例下的模型精度

    图  6  不同压缩网络层和蒸馏比例下LTM和LSM的精度

    图  7  LTM和LSM在个性化权值方案下的性能

    表  1  缩略词表

    英文缩写 英文全称 中文全称
    FL Federated Learning 联邦学习
    IoV Internet of Vehicle 车联网
    DAG Directed Acyclic Graph 有向无环图
    CAV Connected and Automated Vehicle 智能网联汽车
    RSU Road Side Unit 路侧单元
    LSM Local Student Model 本地学生模型
    LTM Local Teacher Model 本地教师模型
    TSP Traffic Signs Preprocessed 交通标志预处理
    CNN Convolutional Neural Network 卷积神经网络
    1  基于DAG区块链的异步联邦互蒸馏学习算法(DAFML)

     输入:最大全局训练轮次 $K$,初始模型$w_{\rm s}^{(0)}$,
     衰减阈值$\delta $,本地迭代轮次$R$,学习率$\eta $
     输出:最优全局学生模型$w_{\rm s}^*$和LTM $ w_{n,{{\mathrm{t}}}}^*,\forall n \in {{\mathcal{N}}} $
     (1)随机初始化LTM $w_{n,{t}}^{(0)},\forall n \in {{\mathcal{N}}}$
     (2)for $k = 1:K$
     (3)  if 网络中CAV处于空闲 then
     (4)   等概抽取一个空闲CAV作为本轮训练的CAV $n$
     (5)  end if
     (6)  从Tips中随机抽取5个Tips测试其模型精度
     (7)  选取精度最高的两个模型$w_{{{\mathrm{a}}},{{\mathrm{s}}}}^{(k)}$和$w_{{{\mathrm{b}}},{{\mathrm{s}}}}^{(k)}$
     (8)  聚合LSM$w_{n,{{\mathrm{s}}}}^{(k)} = (w_{{{\mathrm{a}}},{{\mathrm{s}}}}^{(k)} + w_{{{\mathrm{b}}},{{\mathrm{s}}}}^{(k)})/2$
     (9)  测试LTM和LSM的精度$ {{\mathrm{acc}}}_{n,{{\mathrm{t}}}}^{(k)} $和$ {{\mathrm{acc}}}_{n,{{\mathrm{s}}}}^{(k)} $
     (10) 计算个性化权值$\lambda _{n,{{\mathrm{t}}}}^{(k)}$和$\lambda _{n,{{\mathrm{s}}}}^{(k)}$
     (11) for $r = 1:R$
     (12) 根据(7)和(8)计算$\ell _{n,{{\mathrm{t}}}}^{\rm{CE}}$和$\ell _{n,{{\mathrm{s}}}}^{\rm{CE}}$
     (13) 根据(11)和(12)计算$ \ell _{n,{{\mathrm{t}}}}^{\rm{KD}} $和$ \ell _{n,{{\mathrm{s}}}}^{\rm{KD}} $
     (14) 根据(5)和(6)计算$\ell _{n,{{\mathrm{t}}}}^{\rm{UF}}$和$\ell _{n,{\mathrm{s}}}^{\rm{UF}}$
     (15) 根据(13)更新LTM $w_{n,{{\mathrm{t}}}}^{(k,r + 1)}$
     (16) 根据(14)更新LSM $w_{n,{{\mathrm{s}}}}^{(k,r + 1)}$
     (17) end for
     (18) 将$w_{n,{{\mathrm{s}}}}^{k,R}$打包成New Tip并上传至相邻的RSU
     (19)end for
    表  2  IID和NonIID场景下的模型精度

    算法 IID NonIID($\alpha = 10$)
    DADFL $ 64.1 \pm 0.1 $ $ 82.3 \pm 0.1 $ $61.8 \pm 0.3$ $ 82.8 \pm 0.3 $
    FedDistil $65.6 \pm 0.2$ $77.7 \pm 0.6$ $64.8 \pm 0.5$ $79.9 \pm 0.7$
    FedNTD $64.8 \pm 0.3$ $84.0 \pm 0.2$ $63.3 \pm 0.3$ $82.1 \pm 0.3$
    P-FedAvg $62.5 \pm 0.1$ $82.3 \pm 0.1$ $62.0 \pm 0.2$ $83.4 \pm 0.1$
    FedProx $63.4 \pm 0.2$ $85.0 \pm 0.3$ $62.1 \pm 0.2$ $84.2 \pm 0.2$
    DAFML $65.8 \pm 0.2$ $86.9 \pm 0.3$ $65.7 \pm 0.5$ $85.5 \pm 0.1$
  • 加载中
图(7) / 表(3)
