A Discrete Side-lobe Clutter Recognition Method Using Space-time Steering Vectors for Space Based Radar System
-
摘要: 由于天基雷达覆盖范围广,大量强离散杂波(小型岛礁、陆地铁塔等)会从天线旁瓣进入雷达系统,其多普勒特征与目标相同,极易造成虚警。针对以上问题,该文提出基于空时导向约束的天基雷达离散旁瓣杂波判别方法,该方法首先选取空时自适应处理(STAP)杂波抑制后检测到的潜在“目标”(包含真实目标与离散旁瓣杂波)距离多普勒单元及其附近单元;然后根据杂波多普勒频率与空间角度的耦合关系获得各杂波单元对应的空时导向矢量;最后利用获得新的导向矢量构成的滤波器再次对“目标”距离多普勒单元及其附近单元进行滤波处理,此时真实目标信杂噪比会大幅度降低,而离散旁瓣杂波信杂噪比变化不大,从而实现离散旁瓣杂波的判别。理论分析及机载实测数据处理证明该方法具有良好的稳健性和可靠性。Abstract: On account of the large coverage of space based radar, a lot of discrete strong side-lobe clutter, which shares familiar Doppler feature with the real moving targets, can be received by the radar system and hence results in false alarms. For this problem, a discrete side-lobe clutter recognition method using space-time steering vectors for space based radar system is proposed. In this method, the “Suspected targets”, including both the real moving targets and discrete side-lobe clutter, are detected after suppressing clutter by employing the Space-Time Adaptive Processing (STAP). The range-Doppler cells where “suspected targets” located in or around are selected. Afterwards, the space time steering vectors of them are obtained based on the coupling relationship between Doppler frequencies and space angles of clutter. Lastly, the above range-Doppler cells are processed again by the adaptive processing filters which are derived from the new space-time steering vectors. Obviously, the signal-clutter-noise ratio of real moving target will be reduced significantly, while it will not change much for the discrete side-lobe clutter. Therefore, the discrete side-lobe clutter can be identified by using the proposed method. Theoretical analyses and multi-channel airborne radar experiments demonstrate the effectiveness and stability of this method.
-
1. 引言
近年来,随着电子信息技术的发展,图像数据在维度与数量上双重爆发式增长,导致视觉特征与高层语义之间“语义鸿沟”逐渐增大,成为视觉感知领域的瓶颈,因此如何从图像中提取有效的低维数据来提高视觉感知的性能成为一个重要的问题[1-3]。作为一种著名的子空间学习方法,非负矩阵分解(Nonnegative Matrix Factorization, NMF)可以以适当的方式在低维子空间中表达高维数据,进而可以更好地揭示数据的潜在结构信息,并提高各种模式感知算法的能力[4]。由于NMF算法的非负性子空间表达更符合人们心理学和生理学对整体数据感知的描述,而且其对整体数据的分解符合纯加性的感知,这也更易于直观的理解,因此它在某种意义上抓住了数据描述的本质,这与其他子空间学习方法(例如矢量量化(Vector Quantization, VQ)、主成分分析(Principal Component Analysis, PCA)、奇异值分解(Singular Value Decomposition, SVD)等)相区别。NMF在多种任务中取得了令人印象深刻的性能,例如社区检测[5]、高光谱解混[6]、面部特征提取[7]、推荐系统[8]等。
传统NMF算法的缺点之一是忽略了数据集的固有结构,该问题表现在多个方面。首先,样本之间的相关性可能存在于原始数据集中,所以希望可以利用这些相关性信息来提高NMF的性能;其次,特征之间存在一定的相关性,基于高斯误差的
L2 距离方法不能准确度量特征之间的距离,这使得样本内部特征的相关性较弱,导致NMF算法对高维空间的平移噪声有着不准确的预估,抑制了算法的性能;最后,原NMF算法在分解过程由于其非负性的约束条件,忽略了编码矩阵的稀疏性约束,导致分解结果的稀疏性较低,进而影响全局的稀疏表达。为了克服上述限制,研究人员主要从两个方面着手优化研究,多数研究围绕算法本身改进展开,如Shirdhonkar等人[9]使用地球真实距离(Earth Mover's Distance, EMD)来测量原始数据矩阵与乘积矩阵之间的差异,从而提出了EMD NMF。由于EMD对不同维度之间的关系敏感,与其他测量方法相比,EMD在感知空间差异上更加准确,因此EMD NMF能提高样本的子空间区分能力;Cai等人[10]结合流形学习的图结构理论提出了GNMF (Graph regularized Nonnegative Matrix Factorization)算法,其使用最近邻图对局部模型进行几何结构建模,旨在找到保留图结构的矩阵分解,因此GNMF保留了固有的几何结构,同时获得了隐藏语义信息的紧凑表示;Qian等人[11]结合EMD NMF与GNMF的建模思想,将Sinkhorn距离以损失函数的形式置入GNMF算法,而提出了SDNMF (Non-negative Matrix Factorization with Sinkhorn Distance)算法,该方法在EMD NMF的基础上提高了计算速度,并保留了空间的结构与特征关联能力,有较好的子空间学习能力;Hoyer[12]提出了一种稀疏的非负矩阵分解方法(Non-negative Matrix Factorization with Sparseness constrains, SNMF),将稀疏约束引入到NMF目标函数中,以控制分解因子的稀疏表示程度,这可以保证基于特征的零件信息表示形式的直接可解释性;Liu等人[13]提出了一种称为CNMF (Constrained Nonnegative Matrix Factorization)的半监督NMF算法,它将一些先验标签信息视为附加的硬约束,并将其集成到NMF模型中以提高区分能力。同时也有研究人员从特征选择与缩放方向入手,优化算法性能,如Li等人[14]通过K邻近算法缩放有效特征,进而放大其他非核心特征的差距,使整体数据更易被定位捕获,Jimenez-Cordero等人[15]通过同性高斯核结合特征关联方法实现特征的缩放处理,从而提出了一种高精度的支持向量机批量分类方法。
但是,这些NMF算法的变体仍然存在各种缺陷。例如,EMD NMF与SDNMF在分解过程中需要重复计算分解因子乘积与原始矩阵之间的距离,这使算法计算非常耗时,虽然SDNMF算法在计算过程中使用熵正则方法去估算整体距离而提高了计算速度,但是整体速度仍然十分缓慢;GNMF缺乏对原始矩阵特征向量之间关系的考虑,导致在处理平移噪声时性能较差;SNMF仅对分解过程施加稀疏约束,但缺乏对输入数据原始结构的约束,导致其子空间学习能力较弱;CNMF使用原始数据的标签信息,尽管提高了算法的性能,但在分解过程中未能充分利用原始数据的局部几何特征和潜在的结构信息,从而限制算法的应用范围及性能。
考虑到NMF中各种信息结构与原始特征向量之间相关性的重要性,本文提出一种基于Sinkhorn距离特征缩放的多约束非负矩阵分解算法(Semi-Supervised Sinkhorn distance sparse and dual-Graph regularized Non-negative Matrix Factorization, S3GNMF),本算法充分利用了流形图结构、稀疏约束以及标签信息来诱导分解,同时基于Sinkhorn距离对原始特征矩阵进行缩放,提高了输入数据中的特征关联性,解决了将Sinkhorn距离引入损失函数而导致的计算效率缓慢问题,同时也提高了算法性能。在数学上,将算法公式化为定义明确的非负约束优化问题,利用KKT (Karush–Kuhn–Tucker)条件推导出交叉迭代规则。此外,通过多组算法在不同的真实数据集和平移噪声数据集上的聚类实验结果证明了所提算法的有效性。
2. 基于Sinkhorn距离特征缩放的多约束非负矩阵分解
作为一种优秀的NMF变种算法,SDNMF算法通过Sinkhorn距离构造损失函数及流形图结构来保持数据的几何特征结构,提高了算法的子空间学习能力,但其缺乏考虑稀疏性与先验标签的诱导分解,因此算法整体子空间学习能力不强,同时由于反复利用Sinkhorn距离计算分解误差值,导致算法速度十分缓慢。为了克服上述问题,本文提出基于Sinkhorn距离特征缩放的多约束非负矩阵分解(S3GNMF)算法。本算法不仅首次将Sinkhorn距离作为原始矩阵的特征缩放工具,提高了特征关联性,而且将标签信息纳入双流形图结构正则化,提高了算法的子空间学习能力,同时引入稀疏约束到NMF框架中,使分解因子稀疏化并提高了算法速度,也使算法更加稳定;最后,综合上述方法建立一个集成的S3GNMF算法的目标函数,算法流程示意图如图1所示。
2.1 基于Sinkhorn距离的特征缩放
给定两个离散的直方图
Px 与Py ,距离度量矩阵M 以及单位距离运输量矩阵T ,EMD距离[16]定义了从Px 到Py 的最小运输量,该距离定义为dM(Px,Py)=minπ(x,y)m∑x,y=1MxyTxy,s.t. ∑yTxy=Sx,∀x ∑xMxy=Ey,∀y (1) Txy 表示由x 到y 的运输量,Mxy 则表示x 到y 的地面距离(通常以L1 或L2 距离来定义) ,Sx 代表在x 处需要运输的总量,Ey 是y 处的总运输成本。Cuturi[17]提出了一种利用熵正则化来加速EMD距离的计算方法,该方法称为Sinkhorn距离,Frogner等人[18]提出了一种将平滑传输扩展到非标准化措施的松弛方法,该方法对Sinkhorn距离中传输边缘的平等约束施加了KL散度的软惩罚,得到了一个无约束的近似运输模型,在理论上加速了Sinkhorn距离的计算。该距离方法可表示如式(2)所示dα,ϵM(Px,Py)=minπ(x,y){m∑x,y=1MxyTxy+1αH(T)+ε(~KL(T1||Px)+~KL(TT1||Py))} (2) 其中,
~KL(T1||Px) 表示T1 与Px 之间的KL散度,当ε 足够大时,式(2)满足∑tPxt=∑tPyt=1 。假设式(2)中Px 与Py 相等,可以通过α 与ε 的大小来调整Px 矩阵的缩放。由于Sinkhorn距离能有效地表达在高维距离空间上的实际运输消耗,所以Sinkhorn距离缩放方法更能体现样本内特征的关联性。文献[18]实验数据证明α 为10,ε 为100时,缩放效率最高,Sinkhorn迭代次数为10,输入矩阵为X ,则有S=d10,100M(Xi,Xj)=minπ(i,j){m∑i,j=1MijTij+110H(T)+100(~KL(T1||X)+~KL(TT1||X))} (3) S 矩阵可以有效地实现输入矩阵的特征缩放,从而达到数据预处理的目的。2.2 融合标签信息的双图流形结构
为了充分地利用流形结构对分解过程的正则化约束,本文分别构建了两个图流形结构,在NMF分解过程中对分解因子
V 和U 进行正则化处理。具体而言,首先构造一个真实的最近邻数据图G ,并连接X = [x1,x2,⋯,xn] 中的近邻点。为方便起见,采用0-1加权法构造数据图的权重矩阵,定义为W={1,xi与xj有连接0,xi与xj无连接 (4) V 的流形图结构的拉普拉斯矩阵被定义为:L=D−W ,其中D 是一个对角矩阵,其对角元素Dii 为矩阵W 的第i 行的元素和(或者为对应第i 列的元素和) 。L 是描述空间结构特征的拉普拉斯矩阵。若有一组低维数据V=[vT1,vT2,⋯,vTn]∈Rn×k ,各点之间平滑度关系如式(5)所示R(V)=12n∑i,j=1||vi−vj||2W=(n∑i=1vivTiDii−n∑i,j=1vivTjWij) = Tr(VTDV)−Tr(VTWV)=Tr(VTLV) (5) 为提高数据图结构的正则化能力,将部分原始标签信息引入图结构中,有
V=AZ ,其中Z 为辅助矩阵,A 为标签约束矩阵,并带有原始标签约束信息。可将R(V) 重写为R(V) = Tr(VTLV)=Tr(ZTATLAZ) (6) 相同地,也以同样的方式构造了一个最近邻
U 的流形图结构,其各点平滑度关系为R(U) = Tr(UTDUU)−Tr(UTWUU)=Tr(UTLUU) (7) 该流形图拉普拉斯矩阵为
LU=DU−WU 。2.3 L2,1/2范数稀疏约束
基于稀疏约束的方法可以发掘特征空间的潜在关联,很多研究表明稀疏约束可以选择鉴别性稀疏特征来提高算法的效率和有效性,稀疏约束旨在使用适当的稀疏模型来实现稀疏数据表示。该方法通常使用
Lp,q 的范数形式对分解过程进行约束,是一种常见的提高矩阵分解性能的方法。例如,SNMF[12]在分解过程中对分解因子施加L2 范数稀疏约束使因子更加稀疏,SGCNMF[5]在全局分解误差上添加L2,1 范数稀疏约束使分解误差更加平滑,RGNMF[19]在输入数据的噪声中添加L1 范数约束,以提高对噪声特征的屏蔽能力,但是近年来Xu等人[20]发现Lp 为标准范数,且q 为1/2 时,即Lp,1/2 类的范数约束具有较好的稀疏性约束。因此,S3GNMF算法的基矩阵U 上的L2,1/2 范数稀疏约束为||U||2,1/2=(m∑i=1||Ui||1/22)2 (8) 将
||U||2,1/2 作为正则化项加入目标函数,在优化目标函数时,使用最小化L2,1/2 范数能保证矩阵行列均稀疏,可以提高矩阵整体的稀疏性,使算法局部特征特异性降低,既可以降低噪声对算法的影响,又可以提高算法的泛化能力与计算速度。2.4 S3GNMF目标函数
通过将特征缩放、
R(V) ,R(U) 、稀疏性约束和NMF集成到目标函数中,从而可以得到S3GNMF算法的目标函数为minU,ZOS3GNMF=||S−UZTAT||2F+λTr(ZTATLZAZ)+βTr(UTLUU)+θ||U||1/22,1/2,s.t. U≥0,Z≥0 (9) 其中,
λ ,β 为流形图正则化系数,θ 为稀疏系数,S 为输入原始矩阵的Sinkhorn距离特征缩放结果。3. S3GNMF算法求解
由于S3GNMF算法的非凸性,很难获得全局最优解,所以我们采用梯度下降法来优化目标函数。将算法的目标函数展开重写为
OS3GNMF=Tr((S−UZTAT)(S−UZTAT)T)+λTr(ZTATLZAZ)+βTr(UTLUU)+θ||U||1/22,1/2=Tr(STS)−2Tr(SAZUT)+Tr(UZTATAZUT)+λTr(ZTATLZAZ)+βTr(UTLUU)+θ||U||1/22,1/2 (10) 令
δ 与φ 分别为U≥0 ,Z≥0 的非负约束下的拉格朗日乘子,可以得到目标函数的拉格朗日函数LS3GNMF ,其定义为LS3GNMF = OS3GNMF+Tr(δUT)+Tr(φZT) (11) LS3GNMF 分别对U ,Z 求偏导并令其偏导数为0,有∂L∂U=−2SAZ+2UZTATAZ+2βLUU+2θU+δ (12) ∂L∂Z=−2ATSTU+2ATAZUTU+2λATLZAZ+φ (13) 对式(12)和式(13)应用KKT条件,即
δijuij=0 和φijzij=0 ,代入其中,可得(−2SAZ+2UZTATAZ+2βLUU+2θU)ijuij=0 (14) (−2ATSTU+2ATAZUTU+2λATLZAZ)ijzij=0 (15) 将数据流形图拉普拉斯矩阵
LU=DU−WU 和特征流形图拉普拉斯矩阵LZ=DZ−WZ 代入式(14)和式(15),可得乘法更新规则,如式(16)和式(17)所示uij←uij(SAZ+βWUU)ij(UZTATAZ+βDUU+θU)ij (16) zij←zij(ATSTU+λATWZAZ)ij(ATAZUTU+λATDZAZ)ij (17) 推导出
U ,Z 的乘法更新规则后,S3GNMF算法可以总结如表1所示。表 1 基于Sinkhorn距离特征缩放的多约束非负矩阵分解算法S3GNMF (算法1)输入:原始矩阵X,聚类数k,流形正则化系数λ和β,稀疏约束
系数θ和最大迭代次数M(1)对原始矩阵X进行特征缩放得到矩阵S; (2)随机初始化基矩阵U和辅助矩阵Z;
(3)更新U uij←uij(SAZ+βWUU)ij(UZTATAZ+βDUU+θU)ij;(4)更新Z zij←zij(ATSTU+λATWZAZ)ij(ATAZUTU+λATDZAZ)ij; (5)执行算法步骤(3)和步骤(4) 至最大迭代次数或收敛; 输出:矩阵U和Z 4. 实验结果与分析
标准的图像数据集中图像数据大多是对齐且居中的,而在现实世界中,真实图像可能十分复杂而且主体难以居中,导致无法完美地对齐;在校准主体后仍可能存在局部变形。这些问题均会导致针对标准数据集设计的算法性能受到极大的影响。所以我们尝试在多类标准数据集与非对齐的平移噪声数据上进行算法子空间聚类实验。在第1个实验中,本文使用多种算法对5个标准数据集分别进行了聚类实验,并表明了本文所提算法对标准对齐数据有着更强的子空间学习能力,在第2个实验中,本文使用小范围随机平移的COIL20数据集来模拟非对齐数据,并证明了本方法比以往方法具有更强的鲁棒性。为了公平地比较验证各算法在多方面的有效性,本文将所提算法与其他各NMF算法结果进行比较,所有的实验均基于MATLABR2018b模拟,CPU为Intel Core I7-9700 K。
4.1 数据集
本文基于COIL20与Faces95数据集设计了2个平移噪声数据集,分别在2个平移噪声数据集与5个标准数据集(COIL20, PIE, Faces95, Pixraw10P, JAFFE)上进行了聚类实验,数据集详细说明如表2所示。
表 2 各数据集的详细说明数据集名称 维度大小 类别数 总样本数 数据集类型 COIL20 1024 20 1440 物品 PIE 1024 68 2586 人脸 Faces95 4096 20 400 人脸 Pixraw10P 10000 10 100 人脸 JAFFE 676 10 213 人脸 COIL20-noise 1024 20 1440 人脸+平移噪声 Faces95-noise 4096 20 400 人脸+平移噪声 需要注意的是,所有的标准数据集全是对齐数据,为了考验所提算法针对非对齐数据的学习能力,本文使用小的随机平移来模拟局部变形并在新的数据集上测试了本文方法,以显示其鲁棒性。具体来说,本文的数据集是由以下方法生成的:将数据集中每张图片调整为
(32−ω)×(32−ω) 大小,其中ω∈[1,4] 的整数,然后将调整的图像以随机位置放入32×32的空白图像中,图2—图6展示了上述数据集原始数据以及原始数据与平移噪声数据对比。4.2 参数分析
如上所述,将Sinkhorn距离特征缩放过程中的两个参数
α 和ε 设为固定值(α = 10 ,ε = 100 ),所以本节主要讨论λ,β,θ 3个约束参数。在参数对比实验中,本文在COIL20, PIE, Faces95, Pixraw10P和JAFFE 5个标准数据集,以最大类别数做聚类对比,可以得出最佳的参数组合。例如:COIL20数据集以20作为k 值,然后分别使λ,β,θ 以[0.001, 0.01, 0.1, 0, 1, 10, 100, 1000],进行20次综合实验,取最终聚类结果的平均值做对比,S3GNMF参数对比实验如图7所示。图7中每个点的位置代表了
λ,β,θ 3个参数的具体值,颜色代表了实际的聚类精度,颜色越黄,表示实际聚类精度越高,颜色越蓝表示聚类精度越低。由图7得知,
λ 和β 作为流形正则化参数,β 的取值在10以上时能取得较好效果,λ 更多的是作为特征空间的约束,做整体子空间表达的一个微调,参数取值不宜过大,当λ 取值到1000时,对整体算法效果有负反馈。稀疏系数θ 在上述实验过程中,更多起到的是对分解因子的稀疏约束与平滑噪声中野值点作用,对准确度提升不大,但是对算法性能稳定性有显著提升。4.3 聚类结果与分析
本实验中,以本文所提算法S3GNMF与多个先进NMF算法(NMF[21], CNMF[13], GNMF[10], SNMF[12], SDNMF[11], DSDNMF[22], SODNMF[23], AGNMF[24], ONMF[25], DENMF[26])对上述5个数据集进行子空间学习聚类对比,聚类评价指标为准确度(ACcuracy, AC)与归一化互信息(Normalized Mutual Information, NMI),对应指标越高则表明子空间特征学习能力越强。由于S3GNMF, CNMF, SODNMF, DENMF算法需要部分标签信息,上述半监督NMF方法均抽取了实验数据集的前20%的数据标签作为标记样本。所有的算法最大迭代次数为100,对比算法参数均为参考文献中的最佳参数(例如SODNMF取
α=100,β=0.01,θ=0.1 ),S3GNMF的参数设置为4.2节中实验对比得出的最佳参数组合,实验流程如下:(1) 以原始数据集作为输入数据,实验中设置
k 值为数据集的最大类别数,并作为k−means 的聚类数;(2) 以学习到的低维子空间特征表示作为输入,进行
k−means 聚类,对聚类结果进行AC和NMI评估;(3) 重复执行步骤(1)和步骤(2) 20次,取其平均值与标准差作为最终实验结果。
表3显示了不同算法在5个数据集上的详细聚类结果(每个聚类实验中有两行数据展示,第1行数值代表聚类准确度,第2行数据代表归一化互信息)。
表 3 各算法在标准数据集上的对比(%)数据集 NMF CNMF GNMF SNMF SDNMF DSDNMF SODNMF AGNMF ONMF DENMF S3GNMF COIL20 64.2±2.4 69.6±1.6 68.1±1.5 66.9±1.2 71.2±1.0 72.1±1.3 78.9±0.8 73.1±1.1 66.0±1.5 74.7±1.7 84.1±0.9 77.0±1.4 79.8±1.3 80.8±1.0 71.8±2.0 78.6±1.4 79.7±0.8 86.1±1.5 81.0±0.6 70.9±2.2 82.6±1.7 91.6±1.3 PIE 71.3±0.7 68.8±0.8 72.4±0.9 71.9±0.8 74.6±0.8 75.2±0.6 79.3±1.8 75.8±1.1 74.1±1.5 77.2±1.4 81.5±0.8 67.9±0.7 70.7±0.8 80.5±0.9 72.8±0.8 82.1±0.5 81.2±0.7 85.3±0.5 82.4±0.6 76.0±2.0 84.1±1.8 91.8±0.8 Faces95 43.7±1.2 48.6±1.7 50.2±2.3 49.5±1.8 51.2±2.0 50.6±1.8 53.9±1.5 52.2±1.1 49.2±1.1 53.6±0.9 55.1±1.7 50.8±0.6 57.0±1.3 57.7±1.5 55.0±1.3 60.7±1.2 58.1±1.1 60.7±0.8 60.3±1.0 55.3±1.0 60.1±1.6 62.3±1.1 Pixraw10P 68.7±1.8 80.4±1.7 87.4±2.3 71.4±1.1 83.7±2.4 84.0±2.0 89.0±3.6 84.4±2.0 76.3±2.4 84.3±2.9 90.8±3.8 73.8±1.5 83.8±1.2 88.0±1.4 73.7±1.6 84.0±1.6 84.7±1.8 89.7±2.9 86.0±1.8 78.7±1.6 86.0±2.7 93.8±0.7 JAFFE 66.2±1.8 81.1±2.7 82.8±1.2 76.2±0.8 80.1±1.0 80.4±0.8 90.8±1.9 81.4±1.5 77.5±1.2 90.1±0.5 98.1±0.2 68.9±1.5 82.8±1.9 84.0±1.4 78.0±0.6 81.7±1.3 82.0±0.8 92.1±1.4 83.7±1.3 80.0±1.1 88.7±0.6 97.4±0.4 各算法在两个平移噪声数据集上的聚类实验结果如表4和表5所示,其中
ω 表示空间平移尺度,ω 越大,平移越剧烈。表 4 各算法在平移噪声COIL20数据集上的对比(%)ω NMF CNMF GNMF SNMF SDNMF DSDNMF SODNMF AGNMF ONMF DENMF S3GNMF 1 63.2±2.2 67.6±1.2 69.0±1.5 67.4±1.5 72.3±1.5 74.1±1.8 75.1±1.2 71.7±1.4 65.7±2.2 72.7±2.7 87.2±2.1 75.0±1.4 77.2±1.3 80.5±1.1 70.5±1.3 79.3±1.1 79.9±0.9 84.0±1.1 78.8±0.7 68.1±1.4 74.7±1.9 94.6±0.5 2 52.1±2.3 55.2±1.5 57.7±1.3 56.8±1.6 68.6±1.8 70.1±2.2 63.4±1.6 62.7±1.6 54.0±2.7 61.8±2.6 73.2±2.5 66.7±1.6 69.1±1.5 75.7±1.2 73.9±1.4 80.0±1.5 82.6±1.5 76.1±1.2 75.5±0.8 71.7±1.4 74.5±1.3 85.5±0.9 3 49.8±1.8 50.0±1.3 58.2±1.1 55.6±1.8 60.4±1.9 58.8±2.2 57.2±1.7 56.6±2.0 54.9±2.0 55.0±2.3 63.8±1.9 58.8±0.9 61.9±1.6 69.8±1.1 60.7±1.6 73.4±0.9 73.1±1.3 70.9±0.9 68.4±1.1 60.4±1.4 70.1±2.1 80.8±0.6 4 43.5±1.9 46.7±2.4 48.9±1.6 47.3±2.0 52.5±2.3 53.3±2.5 51.8±1.7 50.9±2.3 47.1±2.1 51.9±1.9 57.6±2.2 55.2±1.1 58.0±1.6 62.2±1.2 60.8±1.2 70.9±0.6 71.3±1.1 65.9±0.8 63.0±1.4 60.4±1.5 64.7±1.7 74.7±0.8 表 5 各算法在平移噪声Faces95数据集上的对比(%)ω NMF CNMF GNMF SNMF SDNMF DSDNMF SODNMF AGNMF ONMF DENMF S3GNMF 1 45.1±0.7 46.2±2.2 49.6±1.8 48.2±1.2 54.1±2.1 53.8±2.5 49.3±1.4 48.2±1.3 47.1±1.8 48.8±1.7 53.4±1.3 53.7±0.6 58.6±1.8 60.3±1.5 55.9±0.9 65.8±1.7 62.7±1.2 55.2±1.7 58.4±1.8 53.4±1.6 58.0±1.4 63.9±0.8 2 44.1±1.0 43.1±1.7 45.6±1.3 43.5±1.2 48.9±2.0 49.2±2.1 46.9±1.3 46.2±1.1 42.9±1.9 47.2±1.3 53.2±0.6 51.8±0.7 50.2±0.8 53.1±1.1 49.9±0.6 58.1±1.7 59.3±1.5 50.2±0.7 49.7±1.2 49.1±1.2 50.6±1.7 62.5±0.7 3 38.5±1.1 37.9±1.3 41.8±1.5 38.5±1.1 45.8±1.7 47.3±1.9 43.2±1.7 42.9±2.2 38.9±2.2 44.2±1.5 49.8±1.5 45.1±0.8 43.7±0.7 44.7±1.1 45.9±0.6 53.1±1.3 55.7±1.3 46.8±0.9 46.4±1.8 45.4±1.8 49.4±2.0 59.9±1.0 4 34.1±1.2 33.7±1.5 38.3±1.7 34.2±1.2 38.9±1.6 39.4±1.7 39.9±1.7 38.5±1.8 34.5±1.8 40.1±1.6 43.5±1.3 40.4±1.1 40.0±0.9 45.9±0.8 39.7±0.5 47.5±1.1 48.0±0.9 47.1±0.9 46.2±0.9 39.2±1.3 47.3±1.9 53.4±0.7 为验证本文所提Sinkhorn距离特征缩放的作用,在S3GNMF基础上移除特征缩放处理后,得到新的算法为(Semi-Supervised sparse and dual-Graph regularized Non-negative Matrix Factorization, S2GNMF),S2GNMF与S3GNMF在上述多个数据集的详细聚类结果如表6所示。
表 6 S2GNMF与S3GNMF的聚类效果对比(%)数据集 PIE Pixraw10P JAFFE COIL20 COIL20
(ω=2)COIL20
(ω=4)Faces95 Faces95
(ω=2)Faces95
(ω=4)S2GNMF 77.6±1.1 83.7±3.7 90.7±0.7 81.5±1.4 69.0±2.9 55.3±2.0 51.0±2.2 48.7±1.1 38.3±0.9 90.2±0.3 85.4±1.2 92.9±0.8 89.9±0.4 85.1±0.6 72.1±1.1 61.8±1.0 58.6±0.6 48.2±0.6 S3GNMF 81.5±0.8 90.8±3.8 98.1±0.2 84.1±0.9 73.2±2.5 57.6±2.2 55.1±1.7 53.2±0.6 43.5±1.3 91.8±0.8 93.8±0.7 97.4±0.4 91.6±1.3 85.5±0.9 74.7±0.8 62.3±1.1 62.5±0.7 53.4±0.7 上述实验数据表明:
(1) 基于流形正则化的算法GNMF, SDNMF, DSDNMF, SODNMF, AGNMF, DENMF, S3GNMF在实验中表现要明显优于其他非流行正则化算法,证明了子空间学习中流形正则化在隐式结构的重要性。
(2) 基于稀疏约束的各类算法在实验中,准确度和归一化互信息的标准差均低于其他非稀疏约束算法,证明了稀疏约束能增加局部学习能力与鲁棒性。
(3) 对于半监督学习算法CNMF, DENMF, SODNMF, S3GNMF,多混合约束算法明显优于单一约束算法,即部分标签信息能提高算法的学习能力,但是仍然需要有其他的子空间学习增强方法来针对有效数据进行学习。
(4) 随着平移噪声强度的增加,S3GNMF算法的性能明显优于其他算法,证明了本文所提的Sinkhorn距离特征缩放与多约束的有效性,其中Sinkhorn距离特征缩放简化了特征矩阵的距离度量,平滑了特征矩阵中野值点对分解结果的影响,而结合多流形隐式结构的正则化使整体算法泛化能力得到了提高,结合
L2,1/2 的稀疏约束,使实验数据十分稳定,而且基矩阵表达的局部特征更为稀疏,更有利于子空间的学习表达。(5) 由表6中S3GNMF和S2GNMF的对比结果可知,Sinkhorn距离对不同维度之间的关系更加敏感,能更好地捕获类间关联,所以S3GNMF中基于Sinkhorn距离特征缩放处理能有效地提高各特征类别之间的关联,从而提高NMF算法的子空间学习能力。
4.4 算法复杂度与速度对比
本节首先分析了S3GNMF算法的复杂度,并讨论了几种对比算法的复杂度,最后设计了一组实验来计算各算法实际运算时间。
假设输入矩阵大小为
m×n ,算法最终迭代次数为t ,k 为分解后的维度。根据本文所提算法步骤,首先输入数据经过Sinkhorn距离特征缩放得到处理后的数据,该步骤算法复杂度为O(n2) ,算法1中构造双图流形结构复杂度为O(mn2+m2n) ,非负矩阵分解阶段复杂度为O(tmnk) ,所以本文所提算法复杂度为O(n2+tmnk+mn2+m2n) 。根据参考文献[ 11-13, 21-26]对各对比算法的复杂度描述,NMF, CNMF, SNMF, ONMF算法复杂度均为O(tmnk) ,GNMF算法复杂度为O(tmnk+mn2) ,SDNMF算法复杂度为O(t2n2+tmnk+mn2) ,DSDNMF算法复杂度则为O(t2n2+tmnk+mn2+m2n) , SODNMF, AGNMF, DENMF算法复杂度均为O(tmnk+mn2+m2n) 。可以看到单约束NMF算法在复杂度上具有明显优势,但是缺乏适当的约束导致算法性能不高,S3GNMF与其他多约束NMF算法在复杂度方面比较类似,其避开了SDNMF与DSDNMF中复杂的O(t2n2) 计算,所以相较于这两种算法有着更小的算法复杂度。接下来本文对比了各算法在COIL20, PIE, Faces95, Pixraw10P和JAFFE 5个数据集上的运算速度,来验证算法的实际计算速度。实验中各算法单独运行20次,且设定最大迭代次数为100,
k 为数据集最大样本种类数,将最终耗时平均值作为对比数值,详细对比数据如表7所示。表 7 各算法在不同数据集的运算速度对比(s)数据集 NMF CNMF GNMF SNMF SDNMF DSDNMF SODNMF AGNMF ONMF DENMF S3GNMF COIL20 0.16 1.17 0.24 0.14 161.52 165.94 0.54 26.74 0.21 2.82 1.25 PIE 0.54 2.33 0.69 0.46 328.17 340.75 1.38 40.88 0.69 7.01 2.61 Faces95 0.08 0.65 0.13 0.07 108.41 132.67 0.38 20.62 0.23 3.53 0.43 Pixraw10P 0.14 1.02 0.19 0.14 138.45 155.90 0.41 37.61 0.12 1.67 0.29 JAFFE 0.04 0.41 0.08 0.03 82.07 94.74 0.20 17.84 0.07 1.42 0.17 由表7可知,SNMF算法分解效率最高,因为适当的稀疏约束有利于算法速度的提高;而以Sinkhorn距离作为损失函数度量方法的SDNMF与DSDNMF计算十分缓慢,这两种方法对平移噪声有一定的鲁棒性提升,结合流形图结构正则化也提高了算法性能,但是计算效率十分低下,其根本原因是Sinkhorn距离计算消耗极大,算法每次迭代均以分解因子的乘积与原始矩阵做距离对比,导致算法计算效率极低。基于欧氏距离的损失函数方法则明显速度更优,AGNMF算法虽然也有着不错的子空间学习能力,但是与SDNMF,DSDNMF算法类似,均在每次迭代中需要进行重复的耗时计算,导致整体运行速度不高,本文所提S3GNMF算法将Sinkhorn距离提取至迭代过程之外,直接对原始矩阵做缩放处理,避免了对Sinkhorn距离的反复计算,结合多流形正则与稀疏约束等,提高了算法性能的同时也提高了算法速度。
5. 结论
本文基于Sinkhorn距离特征缩放结合多流形学习和半监督稀疏非负矩阵分解,提出一种多约束非负矩阵分解算法S3GNMF。首先利用Sinkhorn距离对输入矩阵进行特征缩放,在充分利用缩放矩阵的流形图结构正则化与部分标签信息约束的同时,向基矩阵添加了高效的
L2,1/2 范数稀疏约束,并通过KKT条件推导出算法的乘法交叉更新规则。实验结果表明,S3GNMF算法不论是在标准数据集或是平移噪声数据集上,都取得了十分优秀的子空间学习结果,具有良好的鲁棒性,相比于SDNMF与DSDNMF算法,其在大幅度提高算法速度的同时,也提升了算法的性能。但本算法在运算速度上仍有优化空间,相较于其他单约束NMF算法,不仅运算复杂度更高且运算速度更慢,所以未来将着重研究具有高性能的NMF算法,并将所提算法结合应用在不同的领域[27,28],如信息推荐、图像标记、网络安全等。 -
表 1 机载雷达系统参数
主要系统参数 参数值 波段 L 信号带宽(MHz) 10 脉冲重复频率 (Hz) 2500 雷达平台高度(m) 3300 目标靶机高度(m) 300 接收通道数目 8 表 2 “目标”检测结果
序号 距离(m) 多普勒频率(Hz) 输出信杂噪比(dB) 1 1578 330 22.8 2 2907 –270 23.6 3 2268 –260 21.7 表 3 保护通道与合通道“目标”幅度对比
序号 主通道幅度 保护通道幅度 1 0.22 0.76 2 0.25 0.73 3 0.17 0.56 表 4 重新滤波后的“目标”参数
序号 距离(m) 多普勒频率(Hz) 输出信杂噪比(dB) 1 1578 330 18.5 2 2907 –270 19.2 3 2268 –260 –17.1 -
杨晓超, 王伟伟, 张欣, 等. 一种天基雷达等距离环杂波仿真方法[J]. 现代雷达, 2018, 40(4): 13–17, 49. doi: 10.16592/j.cnki.1004-7859.2018.04.003YANG Xiaochao, WANG Weiwei, ZHANG Xin, et al. A simulation method of space-based radar iso-range ring clutter[J]. Modern Radar, 2018, 40(4): 13–17, 49. doi: 10.16592/j.cnki.1004-7859.2018.04.003 SKOLNIK M I, 南京电子技术研究所译. 雷达手册[M]. 3版. 北京: 电子工业出版社, 2010: 148–152.SKOLNIK M I, Nanjing Institute of Electronic Technology. Radar Handbook[M]. 3rd ed. Beijing: Publishing House of Electronics Industry, 2010: 148–152. LI Huiyong, BAO Weiwei, HU Jinfeng, et al. A training samples selection method based on system identification for STAP[J]. Signal Processing, 2018, 142: 119–124. doi: 10.1016/j.sigpro.2017.07.008 WU Yifeng, WANG Tong, WU Jianxin, et al. Robust training samples selection algorithm based on spectral similarity for space-time adaptive processing in heterogeneous interference environments[J]. IET Radar, Sonar & Navigation, 2015, 9(7): 778–782. doi: 10.1049/iet-rsn.2014.0285 SUN Guohao, HE Zishu, TONG Jun, et al. Knowledge-aided covariance matrix estimation via Kronecker product expansions for airborne STAP[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(4): 527–531. doi: 10.1109/LGRS.2018.2799329 李永伟, 谢文冲. 基于空时内插的端射阵机载雷达杂波补偿新方法[J]. 电子与信息学报, 2019, 41(9): 2115–2122. doi: 10.11999/JEIT181131LI Yongwei and XIE Wenchong. A novel clutter spectrum compensation method for end-fire array airborne radar based on space-time interpolation[J]. Journal of Electronics &Information Technology, 2019, 41(9): 2115–2122. doi: 10.11999/JEIT181131 WEN Cai, PENG Jinye, ZHOU Yan, et al. Enhanced three-dimensional joint domain localized STAP for airborne FDA-MIMO radar under dense false-target jamming scenario[J]. IEEE Sensors Journal, 2018, 18(10): 4154–4166. doi: 10.1109/jsen.2018.2820905 刘斌, 何广军, 冯有前, 等. 静态和差波束匹配的空时自适应处理方法[J]. 西安电子科技大学学报: 自然科学版, 2017, 44(3): 138–143, 169. doi: 10.3969/j.issn.1001-2400.2017.03.024LIU Bin, HE Guangjun, FENG Youqian, et al. Static sum-and-difference beam matched STAP method[J]. Journal of Xidian University, 2017, 44(3): 138–143, 169. doi: 10.3969/j.issn.1001-2400.2017.03.024 XU Huajian, YANG Zhiwei, HE Shun, et al. A generalized sample weighting method in heterogeneous environment for space-time adaptive processing[J]. Digital Signal Processing, 2018, 72: 147–159. doi: 10.1016/j.dsp.2018.10.005 侯静, 胡孟凯, 王子微. 一种改进的知识辅助MIMO雷达空时自适应处理方法[J]. 电子与信息学报, 2019, 41(4): 795–800. doi: 10.11999/JEIT180557HOU Jing, HU Mengkai, and WANG Ziwei. An improved knowledge-aided space-time adaptive signal processing algorithm for MIMO radar[J]. Journal of Electronics &Information Technology, 2019, 41(4): 795–800. doi: 10.11999/JEIT180557 SHNIDMAN D A and TOUMODGE S S. Sidelobe blanking with integration and target fluctuation[J]. IEEE Transactions on Aerospace and Electronic Systems, 2002, 38(3): 1023–1037. doi: 10.1109/TAES.2002.1039418 NARASIMHAN R S, VENGADARAJAN A, and RAMAKRISHNAN K R. Mitigation of sidelobe clutter discrete using sidelobe blanking technique in airborne radars[C]. 2018 IEEE Aerospace Conference, Big Sky, USA, 2018: 1–10. BAO Zheng, WU Shunjun, LIAO Guisheng, et al. Review of reduced rank space-time adaptive processing for airborne radar[C]. International Radar Conference, Beijing, China, 1996: 766–769. 何友, 关键, 孟祥伟, 等. 雷达目标检测与恒虚警处理[M]. 2版. 北京: 清华大学出版社, 2011: 40–50.HE You, GUAN Jian, MENG Xiangwei, et al. Radar Target Detection and CFAR Processing[M]. 2nd ed. Beijing: Tsinghua University Press, 2011: 40–50. YANG Xiaopeng, LIU Yongxu, HU Xiaona, et al. Robust generalized inner products algorithm using prolate spheroidal wave functions[C]. 2012 IEEE Radar Conference, Atlanta, USA, 2012: 581–584. 期刊类型引用(4)
1. 詹珩艺,李亚超,武春风,宋炫,张廷豪. 弹载双基前视成像雷达解析-迭代定位方法. 系统工程与电子技术. 2023(01): 71-78 . 百度学术
2. 尹奎英,黄冠,黄照悠. 基于广义伪距定位的SAR景象匹配导航方法. 雷达科学与技术. 2021(05): 589-597 . 百度学术
3. 黄照悠,尹奎英. 一种基于广义伪距定位的SAR载机平台位置解算方法. 电子测量技术. 2020(18): 64-68 . 百度学术
4. 梁毅,李晴晴,孙昆,党彦锋,丁金闪. 利用SAR图像匹配的弹体定位新方法. 西安电子科技大学学报. 2018(06): 1-6 . 百度学术
其他类型引用(10)
-