进化网络模型: 无先验知识的自适应自监督持续学习

刘壮 宋祥瑞 赵斯桓 施雅 杨登封

刘壮, 宋祥瑞, 赵斯桓, 施雅, 杨登封. 进化网络模型: 无先验知识的自适应自监督持续学习[J]. 电子与信息学报, 2024, 46(8): 3256-3266. doi: 10.11999/JEIT240142
LIU Zhuang, SONG Xiangrui, ZHAO Sihuan, SHI Ya, YANG Dengfeng. EvolveNet: Adaptive Self-Supervised Continual Learning without Prior Knowledge[J]. Journal of Electronics & Information Technology, 2024, 46(8): 3256-3266. doi: 10.11999/JEIT240142
doi: 10.11999/JEIT240142 cstr: 32379.14.JEIT240142
基金项目: 国家自然科学基金 (72272028)






    刘壮 liuzhuang@dufe.edu.cn

  • 中图分类号: TN911.7; TP391

EvolveNet: Adaptive Self-Supervised Continual Learning without Prior Knowledge

Funds: The National Natural Science Foundation of China (72272028)
  • 摘要: 无监督持续学习(UCL)是指能够随着时间的推移而学习,同时在没有监督的情况下记住以前的模式。虽然在这个方向上取得了很大进展,但现有工作通常假设对于即将到来的数据有强大的先验知识(例如,知道类别边界),而在复杂和不可预测的开放环境中可能无法获得这些知识。受到现实场景的启发,该文提出一个更实际的问题设置,称为无先验知识的在线自监督持续学习。所提设置具有挑战性,因为数据是非独立同分布的,且缺乏外部监督、没有先验知识。为了解决这些挑战,该文提出一种进化网络模型(英文名EvolveNet),它是一种无先验知识的自适应自监督持续学习方法,能够纯粹地从数据连续体中提取和记忆表示。EvolveNet围绕3个主要组件设计:对抗伪监督学习损失、自监督遗忘损失和在线记忆更新,以进行均匀子集选择。这3个组件的设计旨在协同工作,以最大化学习性能。该文在5个公开数据集上对EvolveNet进行了全面实验。结果显示,在所有设置中,EvolveNet优于现有算法,在CIFAR-10, CIFAR-100和TinyImageNet数据集上的准确率显著提高,同时在针对增量学习的多模态数据集Core-50和iLab-20M上也表现最佳。该文还进行了跨数据集的泛化实验,结果显示EvolveNet在泛化方面更加稳健。最后,在Github上开源了EvolveNet模型和核心代码,促进了无监督持续学习的进展,并为研究社区提供了有用的工具和平台。
  • 图  1  对比学习+伪监督的对抗自监督学习架构

    图  2  在所有数据集的最终Acc和KNN准确率

    图  3  EvolveNet模型在不同数据集上的准确率与遗忘率曲线

    图  4  在不同$ \lambda $和$ u $下进行的CIFAR-10数据流上的超参数实验

    表  1  不同对比和遗忘损失组合下顺序数据流的平均最终KNN准确率

    表  2  不同损失函数组合下顺序数据流的iLab-20M的平均KNN准确率(%)

    损失函数组合 平均最终KNN准确率
    ${{L}} $rp 85.2
    ${{L}} $bc 82.6
    ${{L}} $rp + Lbc 89.5
    ${{L}} $rp + U 87.3
    ${{L}} $rp + C 88.1
    ${{L}} $rp + U + C 91.2
    ${{L}} $rp + ${{L}} $bc + U 90.4
    ${{L}} $rp + ${{L}} $bc + C 91.0
    ${{L}} $rp + ${{L}} $bc + U + C 92.7
    表  3  在Core-50和iLab-20M上的跨数据集泛化。

    训练数据集⇒ iLab-20M Core-50
    测试数据集⇒ Core-50 iLab-20M
    模型 Acc(↑) $\Delta $(%)(↓) Acc(↑) $\Delta $(%)(↓)
    SimCLR[17] 53.5 17 49.3 26
    EvolveNet 71.6 8 79.9 15
    表  4  EvolveNet模型在CIFAR-10,Core-50和iLab-20M数据集上与带类标签的持续学习算法的性能比较

    模型 CIFAR-10 Core-50 iLab-20M
    Acc(↑) For(↓) Acc(↑) For(↓) Acc(↑) For(↓)
    SimCLR[17] 18.8 11.2 69.3 22.3 85.0 10.8
    LUMP[22] 24.0 8.9 70.7 17.6 88.9 6.2
    DER[14] 20.2 10.1 69.4 21.5 87.3 8.9
    Co2L[30] 30.6 10.7 73.2 18.9 86.6 9.6
    PNN[2] 12.5 38.6 59.8 29.0 71.4 23.3
    EvolveNet 35.1 4.8 79.1 6.7 92.7 5.1
