曾德宇 梁泽逍 吴宗泽

曾德宇, 梁泽逍, 吴宗泽. 基于加权核范数和L2,1范数的最优均值线性分类器[J]. 电子与信息学报, 2022, 44(5): 1602-1609. doi: 10.11999/JEIT211434
ZENG Deyu, LIANG Zexiao, WU Zongze. Optimal Mean Linear Classifier via Weighted Nuclear Norm and L2,1 Norm[J]. Journal of Electronics & Information Technology, 2022, 44(5): 1602-1609. doi: 10.11999/JEIT211434
基金项目: 广东省重点领域研发计划(2021B0101200005),国家自然科学基金 (62073088, U1911401) , 广东省基础与应用基础研究基金 (2019A1515011606)





Optimal Mean Linear Classifier via Weighted Nuclear Norm and L2,1 Norm

Funds: Guangdong Province Key Field R&D Program (2021B0101200005), The National Natural Science Foundation of China (62073088, U1911401), Guangdong Province Basic and Applied Basic Research Fund (2019A1515011606)
  • 摘要: 缺陷检测是智能制造系统的一个重要的环节。在采用传统机器学习算法进行缺陷分类的时候,通常会遇 到数据噪声干扰,降低算法对缺陷类别的预测精度。尽管近几年提出了如鲁棒线性判别分析(RLDA)等强大的算法用于解决数据受稀疏噪声干扰的分类问题,但仍存在一些缺点限制其应用性能。该文提出一种新的基于线性判别分析的最优均值鲁棒线性分类模型(OMRLSA)。不同于以往应对噪声数据的分类方法忽略稀疏噪声具有的拉普拉斯分布特性对数据均值的影响,该文所提出的最优均值鲁棒线性分类模型会自动更新数据的最优均值,从而保证数据的统计特性不会受到噪声的干扰。此外,随后的损失函数中首次在鲁棒分类模型中引入了关于正则化和误差测量的联合L2,1范数最小化和秩压缩的加权核范数最小化方法,从而提高算法的鲁棒性。在具有不同比例损坏的标准数据集上的实验结果说明了该文方法的优越性。
  • 图  1  改进模型

    图  2  YaleB 数据集的一些样本

    图  3  AR数据集的一些样本

    图  4  ORL数据集的一些样本

    图  5  $ \eta $$ \lambda $的性能

    表  1  基于交替方向乘子法求解问题式(12)

     开始:正则化每个样本$ \left\{ {{{\boldsymbol{x}}_i}} \right\} $的2范数为1;
     初始化:$ \mu = 1.2 $,$ 1 \lt {\rho} \lt 2 $,$ {\boldsymbol{D}} = {\boldsymbol{X}} $,$ {\boldsymbol{E}} = 0 $,
         ${ {\boldsymbol{\varGamma } }_1} = \dfrac{ {\boldsymbol{X} } }{ {\left\| {\boldsymbol{X} } \right\|_{\rm{F}}^2} },{ {\boldsymbol{\varGamma } }_2} = { {\boldsymbol{\varGamma } }_1},{\mu _{\max } } = {10^6}$;
     (1) 通过求解$\arg {\min _{\boldsymbol{B} } } = \dfrac{ {\eta} }{2}\left\| { {\boldsymbol{Y} } - { {\boldsymbol{B} }^{\text{T} } }{ {\hat {\boldsymbol{D} } } } } \right\|_{\rm{F}}^2$$ + \dfrac{{\gamma}}{2}{\left\| {\boldsymbol{B}} \right\|_{2,1}} $更新B
     (2) 通过求解$\arg {\min _{ { {\hat {\boldsymbol{D} } } } } } = \dfrac{ {\eta} }{2}\left\| { {\boldsymbol{Y} } - { { {\boldsymbol{B} }\hat {\boldsymbol{D} } } } } \right\|_{\rm{F} }^2$
       $+\dfrac{ {\gamma} }{2}\left\| { { {\hat {\boldsymbol D} } } - \left[ { {\boldsymbol{D} };{ {\bf{1} }^{\text{T} } } } \right] + \dfrac{ { { {\boldsymbol{\varGamma } }_2} } }{\mu } } \right\|_{\rm{F} }^2$更新$ {{\hat {\boldsymbol D}}} $;
     (3) 通过求解$\dfrac{1}{\mu }{\left\| {\boldsymbol{D} } \right\|_*} + \dfrac{1}{2}\left( {\left\| { {\boldsymbol{D} } - {\boldsymbol{P} } } \right\|_{\rm{F}}^2 + \left\| { {\boldsymbol{D} } - {\boldsymbol{Q} } } \right\|_{\rm{F} }^2} \right)$更新
       ${\boldsymbol{P} } = {\boldsymbol{X} } - {\boldsymbol{E} } - {\boldsymbol{b} }{ {{{\textit{1}}} }^{\text{T} } } + \dfrac{ { { {\boldsymbol{\varGamma } }_1} } }{\mu }$, $ {\boldsymbol{Q}} = {\left[ {{{\hat {\boldsymbol D}}} + \dfrac{{{{\boldsymbol{\varGamma }}_2}}}{\mu }} \right]_{\left( {1:{\text{d}}x,:} \right)}} $;
     (4) 通过求解$\dfrac{ {\text{λ } } }{\mu }{\left\| {\boldsymbol{E} } \right\|_{2,1} } + \dfrac{1}{2}\left\| { {\boldsymbol{E} } - { {\hat {\boldsymbol X} } } } \right\|_{\rm{F}}^2$更新E
       其中${ {\hat {\boldsymbol X} } } = {\boldsymbol{X} } - {\boldsymbol{E} } - {\boldsymbol{b} }{ {{{\textit{1}}} }^{\text{T} } } + \dfrac{ { { {\boldsymbol{\varGamma } }_1} } }{\mu }$;
     (5) 通过${ {\boldsymbol{\varGamma } }_1} = { {\boldsymbol{\varGamma } }_1} + \mu \left( { {\boldsymbol{X} } - {\boldsymbol{D} } - {\boldsymbol{E} } - {\boldsymbol{b} }{ {{{\textit{1}}}}^{\text{T} } } } \right)$
       ${ {\boldsymbol{\varGamma } }_2} = { {\boldsymbol{\varGamma } }_2} + \mu \left( { { {\hat {\boldsymbol D} } } - \left[ { {\boldsymbol{D} };{ {{{\textit{1}}} }^{\text{T} } } } \right]} \right)$和
       $ \mu = \min \left( {{\rho}\mu ,{\mu _{\max }}} \right) $更新${{\boldsymbol{\varGamma}} }_{1},{{\boldsymbol{\varGamma}} }_{2}$和$ \mu $;
     (6) 判断是否收敛;
     输出:B*, D*, E*
    表  2  单次迭代计算复杂度分析

    计算${\boldsymbol{\varSigma } }$dxdxcO(dxc)
    计算${ {\hat {\boldsymbol{D} } } }$(dx+1)2(dx+1)2c+(dx+1)2cnO((dx+1)2c)
    表  3  各个算法在ORL数据集、AR 数据集和YaleB 数据集的识别率

