Extraction of Attributed Scattering Center Based on Physics Informed Machine Learning
-
摘要: 基于参数化散射中心模型进行参数估计是实现合成孔径雷达高级信息获取(SAR AIR)技术的基本思路之一,传统的属性散射中心(ASC)参数估计算法往往具有计算速度慢、算法复杂度高、对参数初值要求高等问题。对此,该文提出一个新的基于无监督学习的端到端框架用于从SAR图像反演ASC参数。首先,利用自编码式网络结构有效提取目标图像特征,缓解由于优化空间复杂非凸导致的直接求解困难,解决初值敏感问题;其次,通过嵌入ASC模型作为物理解码器以将编码器输出约束为正确的ASC参数;最后,通过端到端的模型架构进行学习和推理,达到降低算法复杂度及提高估计速度的目的。通过在仿真和实测数据上进行测试,实验结果表明在0.15 m分辨率测试集SAR图像上取得低于0.1 m的估计误差,反演单个散射中心平均耗时0.06 s,验证了该文所提方法的有效性、高效性与鲁棒性。
-
关键词:
- 属性散射中心模型 /
- 参数估计 /
- 基于物理知识的机器学习
Abstract: To estimate parameters of parameterized scattering center models is one of the basic methods for Synthetic Aperture Radar Advanced Information Retrieval (SAR AIR). Traditional Attributed Scattering Center (ASC) parameter estimation algorithms usually suffer from issues such as slow computation speed, high algorithm complexity, and high sensitivity to initial values of parameters. In this paper, a novel end-to-end framework for inverting ASC parameters from radar images based on unsupervised deep learning is proposed. Firstly, an autoencoder network structure is employed to effectively extract image features of targets, alleviating the difficulties solving directly caused by the complex non-convex optimization space and resolving the sensitivity to initial values. Secondly, the ASC model is embedded as a physical decoder to constrain the encoder output to correct ASC parameters. Finally, the end-to-end architecture are utlized to train and infer the model, achieving the purpose of reducing algorithm complexity and improving estimation speed. Through testing on simulated and measured data, experimental results indicate that the estimation error obtained on the SAR image test set with a resolution of 0.15 m is less than 0.1 m while the average processing time is 0.06 s for the inversion of one single scattering center, which demonstrate the effectiveness, efficiency, and robustness of the proposed approach. -
1. 引言
合成孔径雷达(Synthetic Aperture Radar, SAR)技术的发展呈现出高分辨率、高数据空间维度、成像模态多样化的趋势[1]。SAR高级信息获取技术作为电磁散射与成像这一正向过程的逆问题,其目的是场景重建,即将高分辨率多维SAR数据描述的场景重建为人类可以理解的形式。根据重建过程是否基于物理模型,可将SAR目标重建工作归纳为两类,即无物理模型方法和基于物理模型的方法。
在计算机视觉领域,数据驱动的深度学习方法已取得巨大成功。近几年,深度学习方法也被用于SAR图像的目标重建。例如,Chen等人[2]构建了SAR点云生成网络(SAR Point Generation Net, SARPGN),用于高分辨率SAR图像的建筑目标提取和3维重建。Peng等人[3]提出一种SAR-to-3D网络,使用条件生成对抗网络将运动和静止目标获取与识别数据集(Moving and Stationary Target Acquisition and Recognition, MSTAR)的车辆图像转换成光学图像,再利用光学数据数量丰富的优势,基于预训练好的网络从光学图像中重建3维点云。这些无物理模型方法能较好地恢复目标整体形状,但依赖于点云进行表征的重建结果缺乏目标细节信息,无法实现对目标局部结构的精细刻画,另外,摒弃对复杂电磁散射机理的考虑,需要从大量数据中学习特征。
与中低分辨率SAR图像单个像素包含大量点目标不同,高分辨率SAR图像中的人造目标往往表现为孤立分散的强散射点,这些强散射点可以用散射中心进行建模,对应于不同的散射机制或结构。因此,可以基于目标散射机制的物理模型发展适用于高分辨率SAR图像的信息获取技术。
通过参数化散射中心模型可以将目标重建转换成一个参数估计问题,与正向的基础模型建模研究交织发展,国内外已有很多相关工作,文献[4]进行了全面的梳理。其中,区域解耦最大似然算法(Region Decoupled-Approximate Maximum Likelihood-CLEAN, RD-AML-CLEAN)[5]依次选取散射最强的散射点,完成估计后从图像中去除其响应,从而在提取第n+1个区域的散射特征时不会受到前n个区域的影响。类似采用近似极大似然(Approximate Maximum Likelihood, AML)估计的工作还有基于参数降耦合算法[6]、基于协同粒子群优化算法[7]等。除了基于极大似然估计方法,还发展了引入稀疏性先验的估计方法:文献[8–10]等基于目标散射场的稀疏特性,使用牛顿正交匹配追踪(Orthogonal Matching Pursuit, OMP)求解SAR信号的稀疏表示。相比于无物理模型方法,这些基于参数化散射中心模型的方法充分利用先验信息,能重构出符合电磁散射机理的精细散射体结构。然而,其多使用迭代优化的求解策略,对参数初值精度要求高,需要对不同参数采取具体的初始化策略,否则在优化时极易陷入局部最优,且往往面临算法复杂度高、计算速度慢等问题。
在SAR自动目标识别(SAR Automatic Target Recognition, SAR ATR)领域,已有许多工作尝试将散射中心模型与神经网络结合,基于数据与模型共同驱动的方法提升网络对SAR图像的解译能力、赋予网络一定的可解释性。然而,这些研究多聚焦于分别提取图像和散射两类特征,在特征层[11,12]或决策层[13]进行融合以获取更有利于识别或者分类的特征向量,其多将散射参数作为先验已知,并不以散射参数估计为目标。
综上,为了弥补传统的基于模型求解方法在初值敏感度及计算耗时上的局限性,本文发展基于属性散射中心模型的无监督深度学习方法实现对目标的参数估计。本文提出一种物理启发的内嵌散射机制自编码器网络架构,基于神经网络与散射中心模型分别实现编码器与解码器部分,使用仿真数据进行端到端训练,并通过引入KL散度(Kullback-Leibler Divergence, KLD)损失项避免过拟合问题。本文首先简要介绍属性散射中心模型(Attributed Scattering Center, ASC);其次详细说明提出的单散射体SAR图像散射中心估计方法,给出建模方法及其思想出发点、模型的网络结构细节、模型优化目标的理论推导;然后在仿真组合目标图像和实测角反组图像上进行测试,并将统计分析结果与传统迭代算法及有监督深度学习算法进行对比,结果证明该方法在反演速度、精度、泛化性上均占有较大优势,能够在不依赖参数初值的情况下,以快速的推理速度取得较好的参数反演与图像重建效果;最后,指出该方法目前的局限性,讨论了基于物理的机器学习中神经网络与物理模型的相互作用机理。
2. 属性散射中心模型
复杂电大尺寸人工目标的散射具有局部性特点,其回波可认为由若干个局部散射源的电磁散射相干叠加形成,这些散射源被称为散射中心,在SAR图像上表现出一种稀疏性。散射中心模型用一组参数化数学公式描述目标散射随雷达入射频率和角度的依赖性,一般可写为
S(f,Ω;Θ)=M∑i=1Si(f,Ω;Θi) (1) 其中,S表示目标整体电磁散射,Si表示局部散射源的电磁散射,f和Ω分别为雷达入射波的频率和角度(包括方位角φ与俯仰角θ),Θ={Θi}Mi=1表示某个具有M个散射体的雷达目标的参数集。
根据几何绕射理论,属性散射中心模型[14,15]用幂函数建模散射幅度随频率的变化关系,用衰减指数函数和sinc函数分别建模局部式和分布式散射中心对方位角的依赖,推导了若干种典型散射结构的散射规律。其表达式可以写为
Si(f,φ;Θi)=Ai×(jffc)αi×exp(−j4πfc(xicosφ+yisinφ))×sinc(2πfcLisin(φ−¯φi))×exp(−2πfγisinφ) (2) 其中,fc是入射波中心频率,c是光速,Θi是参数向量,可以表示为
Θi=(Ai,αi,γi,Li,¯φi,xi,yi)T (3) 其中,T表示向量转置。ASC模型中的参数包含了散射中心丰富的物理与几何属性,其物理意义解释如下:xi和yi为第i个ASC散射中心在SAR图像上的距离向和方位向坐标,Ai为复数幅值,αi为频率依赖因子,Li和¯φi分别为分布式散射中心的长度和取向角,γi为局部式散射中心的方位角依赖,对于小角度条件可以忽略。
根据α值和L值的不同,可将散射中心分为不同类型:L=0对应局部式ASC,其中,α=1时,为三面角,α=0.5时,为帽顶,α=0时,为球,α=−1时,为顶点绕射;L>0对应分布式ASC,其中,α=1时,为二面角,α=0.5时,为圆柱,α=0时,为直边镜面反射,α=−0.5时,为边缘绕射。图1给出了这8种典型散射机制的示意图。
在实际工作条件下,局部式散射中心的散射响应与方位观测角无关,或者随角度的变化非常小,因此在本文参数估计中忽略参数γ,即认为式(2)中的局部式散射中心角度依赖项exp(−2πfγsinφ)为1。另外,不考虑目标中各散射体的相对旋转关系,即取向角¯φ规定为0;不考虑平板及目标绕射的贡献,即只考虑频率依赖因子α∈{0,0.5,1}的情况。由此可将式(2)简化为
Si(f,φ;Θi)=Ai×(jffc)αi×sinc(2πfcLisinφ)×exp(−j4πfc(xicosφ+yisinφ)) (4) 基于ASC模型仿真SAR图像的基本流程如下:首先,根据各散射中心的参数设置获得对应散射体的散射场信息;其次,叠加获得目标整体频域的后向散射系数图;然后,对频域数据进行加窗补零处理;最后做2维逆傅里叶变换得到仿真图像。用Win表示加窗函数,ZeroPadding表示补0函数,该过程可由式(5)描述
I(x,y)=IFFT(ZeroPadding(Win(M∑i=1Si(f,φ;Θi)))) (5) 3. 散射中心估计方法
给定一张高分辨率SAR图像s=I(x,y),目标是从中重建一组几何体{Ci}i=1,2,⋯,M以简洁地表示物体的3维形状。依赖属性散射中心模型,每个几何体被描述为一个向量Θi∈RN。根据式(4),取N=5,则几何体Ci可表征为
Θi=(Ai,αi,Li,xi,yi)T (6) 包含位置、尺寸、类别、散射强度等参数。
因此,基于式(4)、式(5)所描述的模型进行参数反演,目标是从观测图像数据中较好地估计目标的散射中心结构类型与几何信息,并以较高的精度重建目标的散射响应。本节详细介绍所提出的ASC散射中心智能提取方法。
3.1 模型设计
根据第2节介绍的属性散射中心模型,从一张高分辨率SAR图像映射到一个几维至几百维的描述目标物理与几何属性的ASC参数集,可以看作是一个编码器,对应散射中心提取这一逆过程;而从参数集映射到SAR图像可看作是对应的解码器,对应SAR图像仿真这一正过程,ASC模型结合加窗补0与逆傅里叶变换等处理提供了该解码过程的物理解析表达。
本文提出,使用自编码架构将正向和逆向过程集成到一个网络模型中,将待反演SAR图像输入编码器,通过最小化模型解码器部分输出的重建仿真图像与其之间的差异,实现目标散射响应的重构。同时,在解码器输出部分可获得对目标散射中心参数的估计结果。自编码器具有强大的信息提取与压缩能力,但在特征维数选取不当的情况下极易过拟合。因此,借鉴变分自编码器(Variational AutoEncoder, VAE)[16]的思想,认为其是一种对自编码器进行正则化以解决过拟合问题的方法,设计了如图2所示的无监督模型。
其中,特征提取模块ψ、参数预测模块β基于神经网络实现,共同组成模型的编码器部分;基于ASC进行SAR成像的物理仿真过程构成模型的解码器部分。对输入的样本数据s,通过特征提取网络建模并拟合对应的后验分布qψ(z|s),采样得到低维隐变量z,易知
p(z)=∑sqψ(z|s)p(s) (7) 从而保证完成训练的模型能够形成一个描述数据集的连续特征空间,使其在推理时有更好的内插能力,更合理地处理未在训练集中出现过的数据。另外,参数预测模块θ的拟合用于建模似然pβ(Θ|z)得到待估计参数Θ,又由于解码器即SAR成像模块中不存在可学习参数,可将参数预测网络与成像模块共同表示为pβ(ˆs|z),对隐变量z进行采样,依次通过两个模块后可以获得与训练数据服从相同分布的重构结果
p(ˆs)=∑zpβ(ˆs|z)p(z) (8) 从整体上看,物理模型的嵌入为整个网络结构提供了可重复使用的归纳偏差,将使得编码器网络学习到的拟合关系与解码器解析表达式的逆函数等效,由此,训练好的编码器应当具备由SAR图像反演目标ASC参数的能力。在3.2节中给出编码器网络,包括特征提取网络与参数预测网络的实现细节;对于解码器部分,即基于ASC模型的SAR仿真成像,在第2节中已有详细说明,本节不再赘述;3.3节给出模型损失函数的推导过程。
3.2 编码器网络
特征提取网络qψ(z|s)将每张输入的SAR图像s编码为一个服从高斯分布的隐变量z,而非一个确定性特征向量,将预测的z分布与标准高斯分布N(0,1)之间的KL散度作为损失函数的一部分,避免模型退化为普通自编码器而陷入过拟合问题。
具体来说,特征提取模块由全卷积网络实现,首先使用6层包含一个2维卷积和一个ReLU激活函数的卷积层提取有用特征,将128×128大小的图像逐层压缩为一个256×2×2大小的向量。通过一个2维卷积层,向量被继续压缩到2T×1×1大小,其中隐变量维度T为预先设定的超参数。将该特征向量一分为二,得到两个T×1×1大小的向量,作为网络建模的高斯后验分布的均值μ∈RT和标准差σ∈RT。由于采样过程不可导,可使用参数重整化策略,从服从标准高斯分布N(0,1)的随机噪声n∈RT中采样,通过参数变换获得的隐变量z∈RT等价于从高斯分布N(μ,σ2)中采样的结果
z=μ+σ⊙n (9) 其中⊙代表逐元素乘法。
参数预测网络pβ(Θ|z)将特征提取网络输出的隐变量z∈RT映射为散射体参数集Θ∈RM×N,M和N分别表示散射体个数和描述各散射体的ASC参数个数。本文仅研究单散射体的参数估计,因此取M=1;根据式(4),取N=5。
参数预测模块由一个全连接层和一个自定义激活函数组成。该自定义激活函数的设计体现了先验知识对模型的指导作用。输出参数集矩阵的各行即散射体参数用式(6)描述,依赖成像空间大小设计如表1所示的自定义激活函数,对参数集矩阵的各列用不同的函数激活,其输出作为模型对ASC参数的预测值,送入成像模块依次计算得到频域数据、加窗结果、图像重建结果。
表 1 参数预测模块中的自定义激活函数参数集矩阵列 对应参数 激活函数 1 x 4×tanh() 2 y 4×tanh() 3 A 10×sigmoid() 4 α sigmoid() 5 L 4×sigmoid() 3.3 损失函数
在本文设计的无监督框架中,无需提供待反演参数的真值作为标签,而是通过最小化重建图像与输入图像间的距离完成训练。更准确地说,将优化目标设定为最小化由网络建模的SAR图像s和隐变量z的联合概率分布q(s,z)与真实联合概率分布p(s,z)之间的KL散度
KL(q(s,z)||p(s,z))=∬q(s,z)lnq(s,z)p(s,z)dzds=∫q(s)[∫q(z|s)lnq(s,z)p(s,z)dz]ds=Es∼q(s)[∫q(z|s)lnq(z|s)q(s)p(s,z)dz] (10) 易知
lnq(z|s)q(s)p(s,z)=lnq(z|s)p(s,z)+lnq(s) (11) 将所求期望拆分为两项,其中
Es∼q(s)[∫q(z|s)lnq(s)dz]=Es∼q(s)[lnq(s)]=c (12) c为常数。进而可将KL散度写为
KL(q(s,z)||p(s,z))=Es∼q(s)[∫q(z|s)lnq(z|s)p(s,z)dz]+c (13) 由此可推得损失函数的表达式
L=Eq(s)[−∫q(z|s)lnp(s|z)dz+∫q(z|s)lnq(z|s)p(z)dz]=Eq(s)[−Ez∼q(z|s)[lnp(s|z)]+KL(q(z|s)||p(z))] (14) 式(14)中所求期望的第1项为SAR图像s的重建损失Lrecon,对其最小化以保证模型学习合理特征并正确反演图像对应的ASC参数,在实现上可以用均方误差(Mean Squared Error, MSE)作为评价指标
Lrecon=Nx∑x=1Ny∑y=1[I(x,y)−ˆI(x,y)]2 (15) 其中,Nx和Ny为图像两个维度的像素点数。
式(14)中所求期望的第2项是特征提取网络建模的后验分布qψ(z|s)与隐变量先验分布p(z)之间的KL散度LKL-div,一般假定p(z)∼N(0,1)。如3.2节所述,对该项的最小化是为了在保证重构精度的前提下,允许一定噪声存在以使得模型学习到连续特征空间,具备更好的推理能力。下面继续给出该项损失函数的具体实现形式
LKL-div=KL(N(μ,σ2)||N(0,1))=∫1√2πσ2e−(z−μ)2/2σ2⋅(lne−(z−μ)2/2σ2/√2πσ2e−z2/2/√2π)dz=∫1√2πσ2e−(z−μ)2/2σ2⋅ln{1√σ2exp{12[z2−(z−μ)2/σ2]}}dz=12∫1√2πσ2e−(z−μ)2/2σ2⋅[−lnσ2+z2−(z−μ)2/σ2]dz=12T∑l=1(−lnσ2(l)+μ2(l)+σ2(l)−1) (16) L=λ1×Lrecon+λ2×LKL - div (17) 综上,使用式(17)给出的总损失函数L对网络进行端到端训练,其中λ1和λ2作为模型超参数,实验时根据训练收敛情况进行调整。由于模型内部完全可微,通过后向传播损失函数梯度,将使模型具有SAR图像重建能力。又因为编码器输出的ASC参数集和解码器输出的重构SAR图像有一一对应关系,因此,重构出SAR图像也就意味着完成了对散射参数的估计。结合图2,算法1给出了所设计的基于内嵌散射机制变分自编码器模型进行ASC参数估计的训练算法。
表 1 内嵌物理的变分自编码器训练算法输入:观测数据D={s(1),s(2),⋯,s(d)} 批处理大小n,学习率α,KL散度权重ωkld,重建损失权重ωrec 隐变量维度T,散射体个数M,单散射体参数个数N,雷达系统参数sys 随机初始化:特征提取网络ψ,参数反演网络β 重复: 在数据集中随机选择1个处理批次S={s(1),s(2),⋯,s(n)} 循环,对每个s(i)∈S (i=1∼n): 从标准高斯分布N(0,1)中生成噪声 n(i)=[n(1),n(2),⋯,n(T)]T 隐变量服从分布的均值与标准差 μ(i)=[μ(1),μ(2),⋯,μ(T)]T,σ(i)=[σ(1),σ(2),⋯,σ(T)]T←Extr(s(i);ψ) 隐变量 z(i)←μ(i)+σ(i)⊙n(i) 估计的ASC参数集 Θ(i)=[Θ(1),Θ(2),⋯,Θ(M×N)]T←Pred(z(i);β) 由估计参数重建图像 ˆs(i)←Imag(Θ(i);sys) 图像重建损失 L(i)recon←λ1×∑Nxx=1∑Nyy=1[s(i)xy−ˆs(i)xy] KL散度损失 L(i)KL←−λ2×12∑Tl=1[1+ln(σ(i)l)2−(μ(i)l)2−(σ(i)l)2] 结束循环 参数预测网络参数更新 β←β−α∂[1/1nn∑ni=1L(i)recon]∂β 特征提取网络参数更新 ψ←ψ−α∂[1/1nn∑ni=1(L(i)recon+L(i)KL)]∂ψ 直到 收敛 4. 实验结果与分析
4.1 训练环境与参数配置
仿真雷达系统参数设置如下:中心频率9 GHz,频率范围为8.4~9.6 GHz,方位角范围为−3.8∘~3.8∘,频域与方位采样点数Nf,Nφ均为128。则成像空间
Δx=c2BNf=16m (18) Δy=c/fc2ΔφNφ≈16m (19) 根据成像空间大小,对参数假设相应的先验分布,如表2,通过在设定的均匀先验分布中采样产生一批参数集,再利用式(5)描述的成像方法产生一批仿真图像数据集。为了使数据集中分布式散射中心和局部式散射中心的数量尽量均衡,对L的采样方法是先在[–4,4]均匀分布中采样,然后将L值小于4的样本置为0,以表示局部式散射中心。共采样产生7000个样本,其中6000个作为训练集供网络模型学习,1000个作为验证集和测试集,用于评估模型的反演与重构效果。
表 2 数据集参数的先验分布参数 假设的先验分布 x [–4,4] 均匀分布 y [–4,4] 均匀分布 A [0,10] 均匀分布 α {0,0.5,1} 离散均匀分布 L {0,(0,4]} 均匀分布 根据算法1,设置隐变量维度为5,散射体个数为1,每个散射体参数个数为5,重建损失权重、KL散度权重分别为λ1=1,λ2=1e−3。该网络用PyTorch框架实现,所有训练任务均在NVIDIA GeForce RTX 3090上进行,网络参数进行kaiming随机初始化,使用Adam优化器,总共迭代1 000个epoch,设置批处理大小和学习率分别为128和1e–4。
如图3所示为模型在训练时的损失Loss随迭代次数Epoch的下降过程,四条曲线分别表示训练集总损失、验证集总损失、训练集的重建损失、训练集的KL散度。可以观察到,与普通VAE模型相比,嵌入散射机制后的生成模型有更快的收敛速度,且最终能收敛到一个更小的损失值。这是由于作为一个信息压缩的过程,生成模型在编码器中会损失部分图像信息,重构结果在细节上可能违背SAR图像隐含的物理规律。加入散射机制的约束后,则能实现符合物理规律、更精确的重构,从而实现参数估计目的并能保证一定精度。根据图3(b)所示的下降曲线,最终模型在训练集上的总损失为0.049 5,重建损失即重建图像与原始图像间的MSE为0.021 5,在验证集上为0.070 8,模型大小为2.96 MB。
4.2 ASC模型仿真数据估计结果
为了检验模型对噪声的鲁棒性,对测试SAR图像添加高斯白噪声,图4(a)-图7(a)给出了10 dB信噪比条件下4个测试样本的成像结果,包括分布式散射结构二面角、圆柱,及局部式散射结构三面角、帽顶。根据本文所提方法估计的该4个散射中心样本的ASC参数如表3所示,其中,散射中心1为分布式结构中的二面角,类型反演正确,长度估计误差为0.085 0 m,位置估计误差分别为0.000 4 m和0.027 1 m,误差均小于1个分辨单元;散射中心2为局部式结构中的三面角,类型反演正确,位置估计误差分别为0.004 1 m和0.009 2 m,误差同样均小于1个分辨单元。由估计参数重构的SAR图像如图4(b)-图7(b)所示。由估计参数重建的散射体几何结构如图4(c)-图7(c)所示,表明该方法可以由散射体的SAR图像有效提取其ASC参数。
表 3 ASC参数估计结果散射中心 x (m) y (m) A α L (m) 散射体结构 1 (图4) 真值 –1.1289 –3.0572 3.6384 1 1.3083 二面角 估计值 –1.1285 –3.0843 3.5226 1 1.2233 二面角 2 (图5) 真值 2.6069 –2.7878 2.2421 1 0 三面角 估计值 2.6110 –2.7970 2.2972 1 0 三面角 3 (图6) 真值 –3.2751 1.0433 3.6998 0.5 1.6510 圆柱 估计值 –3.2861 1.0202 3.7055 0.5 1.5857 圆柱 4 (图7) 真值 –0.6156 2.5096 9.7212 0.5 0 帽顶 估计值 –0.6186 2.4470 9.4620 0.5 0 帽顶 上述模型已具备准确、快速反演单散射中心的能力,在其基础上增加图像分割处理即可实现对多散射体SAR图像的反演,本文基于分水岭阈值法进行实验,首先计算整幅SAR图像的最高幅值,然后寻找幅值位于其–10 dB以上的各像素区域生成掩膜,作为散射中心所在区域。图8显示了对某目标的仿真成像与用反演ASC参数重构的SAR图像,表4显示参数反演结果,目标在该观测视角下含6个较强的散射结构(如图8(a)标注),均可实现与原始图像较为一致的重构。其中3个局部式散射中心的长度参数存在一定误差,这是由于分割算法使用简单的二值化处理,使得分布式散射中心两端能量较弱的部分被去除,从而输入单散射中心反演模型的图像就存在散射中心长度被削短现象所导致的。另外,由表4可注意到对频率依赖因子α的估计效果较随机,从而虽然能重构图像,但是对散射中心类型的判断存在偏差,基于属性散射中心模型进行的参数反演问题中,α的估计困难是一个共性问题。分析式(4)可知,频率依赖项(j×f/fc)α对目标的散射响应起到幅度调制作用,在雷达工作相对带宽不大(接近1)的情况下,其引起的幅度调制很小,无论取 0~1 间的任何值都不会对整个表达式的取值有较大改变,因此导致在一般的带宽及信噪比下α难以做到高精度估计。
表 4 某多散射体目标ASC参数估计结果散射中心 x (m) y (m) A α L (m) 散射体结构 01 1.3409 –1.6606 1.5001 1 0 三面角 02 1.7968 1.1601 3.1288 0.5 0 帽顶 03 1.5212 1.8534 1.5308 1 0 三面角 04 2.8507 –2.1188 4.1949 0.5 1.9380 圆柱 05 3.8858 0.9819 3.0929 0.5 1.5939 圆柱 06 2.8479 3.2429 4.0792 0.5 1.3463 圆柱 应用本方法对图9所示的某角反组实测数据成像结果进行反演。其雷达工作频段为14 .6~15.8 GHz,采样点数为128,极化方式为HH极化;雷达观测方位角变化范围为3∘,采样点数为256。经频域补零处理得到800(方位向)×200(距离向)大小的数据矩阵,距离向和方位向的分辨单元分别为0.080 011 m, 0.062 457 m。对图中标记的01,02散射中心区域裁剪为128×128大小的子图像如图10(a)、图10(c),反演和重建结果分别如表5和图10(b)、图10(d)所示。根据以下角反组的实验结果可看出本文所提方法具备在实测数据上应用的潜力。
表 5 角反组实测图像ASC参数估计结果散射中心 x (m) y (m) A α L (m) 散射体结构 01 1.7070 –1.9574 5.3957 1 0 三面角 02 1.1773 –0.1327 2.4347 1 0 三面角 4.3 统计性能分析与对比
为进一步分析该ASC参数估计方法的精度与速度性能,与文献[5]所提RD-AML-CLEAN方法进行对比。RD-AML-CLEAN是较为经典的图像域ASC估计方法,其对各散射中心估计的步骤为:(1)通过粗略估计散射中心方位向长度进行结构选择;(2)通过计算图像幅值沿距离向的质心、计算幅值沿方位向的质心、最小二乘估计、代入比较、2次函数拟合分别初始化参数x,y,A,α,L;(3)通过拟牛顿法(Broyden–Fletcher–Goldfarb–Shanno, BFGS)进行优化。需要说明的是,由频域数据产生SAR图像时,将极坐标格式的频域数据插值为直角坐标格式这一处理会产生较大的计算开销,而在RD-AML-CLEAN的估计步骤中涉及多次该计算,导致其估计速度非常缓慢。通过推导图像上某像素在极坐标系下的直角坐标(pi,jx,pi,jy)和直角坐标系下坐标(ci,jx,ci,jy),有如式(20)的关系
pi,jxci,jx=cos(jΔφNφ)pi,jyci,jy=Nφ(fc+iBNf)sin(jΔφNφ)2jfcsinΔφ2i=[1,Nf],j=[1,Nφ]} (20) 其中,i和j分别为沿距离向和方位向的像素序号。可知当入射波扫频及扫角较小时,插值带来的图像变化可被忽略,且去除该插值处理不会影响参数优化估计算法本身的精度评估,但可以使RD-AML-CLEAN的计算速度有2~3个数量级的提升。因此本文中出现的RD-AML-CLEAN结果均为在去除极坐标频域数据插值处理情况下的结果。
为进一步说明本文所提无监督训练模型的泛化能力,另外进行一组与有监督模型的对比实验:设置其网络部分与原模型一致,但去除原模型中的物理解码器部分,而是提供ASC参数真值作为监督信息。
在进行对比实验时,所评估3种方法均基于以下雷达系统参数进行仿真:扫描频率为8.5~9.5 GHz,观测角度为–5.73°~5.73°,距离向与方位向采样点数均为128,参数估计均在一i5-13400F CPU设备上进行。针对信噪比为–5,0,5,10,15,20 dB的情况分别进行100次独立的蒙特卡罗仿真实验,得到3种方法的各参数估计均方误差曲线如图11所示,平均计算耗时如表6所示。可以观察到,本文方法对距离向位置参数x、散射强度A及频率依赖因子α参数的估计在不同信噪比下均取得最优,方位向位置参数y和长度参数L较差,但仍能保持较高精度;RD-AML-CLEAN方法需要执行迭代优化,即使去除其算法内占主要计算开销的极坐标频域数据插值处理,平均反演一个散射中心仍需4.12 s,本文中完成训练的网络编码器与之相比则快约2个数量级。此外,作为无监督训练得到的模型,本文方法优于同等参数量网络有监督训练后的效果,这是由于使用纯网络方法出现过拟合,即使在训练集上收敛到极小的损失值,但在测试集上表现不佳;本文方法在网络中引入物理约束,从而保证其学习到的映射关系具有更好的泛化能力。
表 6 3种算法的计算耗时(s)本文方法 监督BP神经网络 RD-AML-CLEAN 计算耗时 0.055 1 0.055 0 4.119 4 5. 结束语
本文提出一种物理启发内嵌散射机制的变分自编码器,使用无监督深度学习方法解决属性散射中心模型参数反演任务,采用端到端训练策略,实现了高于传统迭代算法及有监督网络方法的估计精度,且与传统迭代优化算法相比,降低了算法复杂度、提高了计算效率,解决了其对参数初值敏感的问题,并通过对仿真数据和实测数据的实验验证了所提算法的有效性。然而,本文仅围绕单散射体SAR图像与简单组合目标SAR图像进行验证,针对更具普遍性的复杂目标SAR图像,继续使用图像分割策略可能存在难以将紧邻的散射中心分割准确的问题,从而影响估计精度。因此,为更好地应用本方法,需要进一步考虑复杂目标SAR图像中不同散射中心间的耦合问题。
另外,值得讨论的是,在SAR-ATR领域已经有很多从物理可解释角度出发、融合深度学习与物理信息的工作,但其融合一般在特征层或决策层展开,物理模块独立于神经网络之外。在这种融合策略下,一方面,网络从物理知识中吸收的归纳偏差是极其有限的,其黑盒性质完全没有被削弱;另一方面,整个模型不是一个端到端的系统,且物理模块显得喧宾夺主。与特征融合相比,本文所提模型中神经网络与物理模型串行工作,物理模型直接参与指导梯度流的后传,从而给网络部分引入充分的归纳偏差,使网络在训练和推理时受到较强的物理约束。而与将物理模型加入网络计算图[17]相比,本方法又是一种更高层次的融合。在前者的模式下,网络部分的权重和偏置参数可能都是有物理意义的;而对于后者,神经网络和物理模型模块仍然交互工作,不过仅对彼此公开输入或输出。虽然也通过嵌入散射机制改变了整个深度学习模型的计算图,但两者的区别在于,前者的物理模块具有可训练参数,而后者的物理模块无需学习,仅需将梯度后传给网络部分进行更新,其角色等效于一个激活函数。文献[18]中提供了有关物理启发机器学习的详细讨论。
-
表 1 参数预测模块中的自定义激活函数
参数集矩阵列 对应参数 激活函数 1 x 4×tanh() 2 y 4×tanh() 3 A 10×sigmoid() 4 α sigmoid() 5 L 4×sigmoid() 1 内嵌物理的变分自编码器训练算法
输入:观测数据D={s(1),s(2),⋯,s(d)} 批处理大小n,学习率α,KL散度权重ωkld,重建损失权重ωrec 隐变量维度T,散射体个数M,单散射体参数个数N,雷达系统参数sys 随机初始化:特征提取网络ψ,参数反演网络β 重复: 在数据集中随机选择1个处理批次S={s(1),s(2),⋯,s(n)} 循环,对每个s(i)∈S (i=1∼n): 从标准高斯分布N(0,1)中生成噪声 n(i)=[n(1),n(2),⋯,n(T)]T 隐变量服从分布的均值与标准差 μ(i)=[μ(1),μ(2),⋯,μ(T)]T,σ(i)=[σ(1),σ(2),⋯,σ(T)]T←Extr(s(i);ψ) 隐变量 z(i)←μ(i)+σ(i)⊙n(i) 估计的ASC参数集 Θ(i)=[Θ(1),Θ(2),⋯,Θ(M×N)]T←Pred(z(i);β) 由估计参数重建图像 ˆs(i)←Imag(Θ(i);sys) 图像重建损失 L(i)recon←λ1×∑Nxx=1∑Nyy=1[s(i)xy−ˆs(i)xy] KL散度损失 L(i)KL←−λ2×12∑Tl=1[1+ln(σ(i)l)2−(μ(i)l)2−(σ(i)l)2] 结束循环 参数预测网络参数更新 β←β−α∂[1/1nn∑ni=1L(i)recon]∂β 特征提取网络参数更新 ψ←ψ−α∂[1/1nn∑ni=1(L(i)recon+L(i)KL)]∂ψ 直到 收敛 表 2 数据集参数的先验分布
参数 假设的先验分布 x [–4,4] 均匀分布 y [–4,4] 均匀分布 A [0,10] 均匀分布 α {0,0.5,1} 离散均匀分布 L {0,(0,4]} 均匀分布 表 3 ASC参数估计结果
散射中心 x (m) y (m) A α L (m) 散射体结构 1 (图4) 真值 –1.1289 –3.0572 3.6384 1 1.3083 二面角 估计值 –1.1285 –3.0843 3.5226 1 1.2233 二面角 2 (图5) 真值 2.6069 –2.7878 2.2421 1 0 三面角 估计值 2.6110 –2.7970 2.2972 1 0 三面角 3 (图6) 真值 –3.2751 1.0433 3.6998 0.5 1.6510 圆柱 估计值 –3.2861 1.0202 3.7055 0.5 1.5857 圆柱 4 (图7) 真值 –0.6156 2.5096 9.7212 0.5 0 帽顶 估计值 –0.6186 2.4470 9.4620 0.5 0 帽顶 表 4 某多散射体目标ASC参数估计结果
散射中心 x (m) y (m) A α L (m) 散射体结构 01 1.3409 –1.6606 1.5001 1 0 三面角 02 1.7968 1.1601 3.1288 0.5 0 帽顶 03 1.5212 1.8534 1.5308 1 0 三面角 04 2.8507 –2.1188 4.1949 0.5 1.9380 圆柱 05 3.8858 0.9819 3.0929 0.5 1.5939 圆柱 06 2.8479 3.2429 4.0792 0.5 1.3463 圆柱 表 5 角反组实测图像ASC参数估计结果
散射中心 x (m) y (m) A α L (m) 散射体结构 01 1.7070 –1.9574 5.3957 1 0 三面角 02 1.1773 –0.1327 2.4347 1 0 三面角 表 6 3种算法的计算耗时(s)
本文方法 监督BP神经网络 RD-AML-CLEAN 计算耗时 0.055 1 0.055 0 4.119 4 -
[1] 徐丰, 王海鹏, 金亚秋. 合成孔径雷达图像智能解译[M]. 北京: 科学出版社, 2020: 2–5.XU Feng, WANG Haipeng, and JIN Yaqiu. Intelligent Interpretation of Synthetic Aperture Radar Images[M]. Beijing: Science Press, 2020: 2–5. [2] CHEN Jiankun, PENG Lingxiao, QIU Xiaolan, et al. A 3D building reconstruction method for SAR images based on deep neural network[J]. Scientia Sinica Informationis, 2019, 49(12): 1606–1625. doi: 10.1360/SSI-2019-0100. [3] PENG Lingxiao, QIU Xiaolan, DING Chibiao, et al. Generating 3d point clouds from a single SAR image using 3D reconstruction network[C]. IGARSS 2019–2019 IEEE International Geoscience and Remote Sensing Symposium, Yokohama, Japan, 2019: 3685–3688. doi: 10.1109/IGARSS.2019.8900449. [4] 邢孟道, 谢意远, 高悦欣, 等. 电磁散射特征提取与成像识别算法综述[J]. 雷达学报, 2022, 11(6): 921–942. doi: 10.12000/JR22232.XING Mengdao, XIE Yiyuan, GAO Yuexin, et al. Electromagnetic scattering characteristic extraction and imaging recognition algorithm: A review[J]. Journal of Radars, 2022, 11(6): 921–942. doi: 10.12000/JR22232. [5] 计科峰. SAR图像目标特征提取与分类方法研究[D]. [博士论文], 中国人民解放军国防科技大学, 2003.JI Kefeng. Research on SAR image target feature extraction and classification methods[D]. [Ph. D. dissertation], National University of Defense Technology, 2003. [6] 段佳, 张磊, 盛佳恋, 等. 独立属性散射中心参数降耦合估计方法[J]. 电子与信息学报, 2012, 34(8): 1853–1859. doi: 10.3724/SP.J.1146.2011.01302.DUAN Jia, ZHANG Lei, SHENG Jialian, et al. Parameters decouple and estimation of independent attributed scattering centers[J]. Journal of Electronics & Information Technology, 2012, 34(8): 1853–1859. doi: 10.3724/SP.J.1146.2011.01302. [7] 石志广, 周剑雄, 赵宏钟, 等. 基于协同粒子群优化的GTD模型参数估计方法[J]. 电子学报, 2007, 35(6): 1102–1107. doi: 10.3321/j.issn:0372-2112.2007.06.020.SHI Zhiguang, ZHOU Jianxiong, ZHAO Hongzhong, et al. A GTD scattering center model parameter estimation method based on CPSO[J]. Acta Electronica Sinica, 2007, 35(6): 1102–1107. doi: 10.3321/j.issn:0372-2112.2007.06.020. [8] 李飞, 纠博, 刘宏伟, 等. 基于稀疏表示的SAR图像属性散射中心参数估计算法[J]. 电子与信息学报, 2014, 36(4): 931–937. doi: 10.3724/SP.J.1146.2013.00576.LI Fei, JIU Bo, LIU Hongwei, et al. Sparse representation based algorithm for estimation of attributed scattering center parameter on SAR imagery[J]. Journal of Electronics & Information Technology, 2014, 36(4): 931–937. doi: 10.3724/SP.J.1146.2013.00576. [9] YANG Dongwen, NI Wei, DU Lan, et al. Efficient attributed scatter center extraction based on image-domain sparse representation[J]. IEEE Transactions on Signal Processing, 2020, 68: 4368–4381. doi: 10.1109/tsp.2020.3011332. [10] XIE Yiyuan, XING Mengdao, GAO Yuexin, et al. Attributed scattering center extraction method for microwave photonic signals using DSM-PMM-regularized optimization[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 5230016. doi: 10.1109/TGRS.2022.3183855. [11] ZHANG Jinsong, XING Mengdao, and XIE Yiyuan. FEC: A feature fusion framework for SAR target recognition based on electromagnetic scattering features and deep CNN features[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 59(3): 2174–2187. doi: 10.1109/TGRS.2020.3003264. [12] FENG Sijia, JI Kefeng, WANG Fulai, et al. Electromagnetic scattering feature (ESF) module embedded network based on ASC model for robust and interpretable SAR ATR[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 5235415. doi: 10.1109/TGRS.2022.3208333. [13] FENG Sijia, JI Kefeng, ZHANG Linbin, et al. SAR target classification based on integration of ASC parts model and deep learning algorithm[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14: 10213–10225. doi: 10.1109/JSTARS.2021.3116979. [14] GERRY M J, POTTER L C, GUPTA I J, et al. A parametric model for synthetic aperture radar measurements[J]. IEEE Transactions on Antennas and Propagation, 1999, 47(7): 1179–1188. doi: 10.1109/8.785750. [15] POTTER L C and MOSES R L. Attributed scattering centers for SAR ATR[J]. IEEE Transactions on Image Processing, 1997, 6(1): 79–91. doi: 10.1109/83.552098. [16] KINGMA D P and WELLING M. Auto-encoding variational bayes[J]. arXiv: 1312.6114, 2013. doi: 10.48550/arXiv.1312.6114. [17] HORIE M, MORITA N, HISHINUMA T, et al. Isometric transformation invariant and equivariant graph convolutional networks[C]. The ICLR 2021, https://doi.org/10.48550/arXiv.2005.06316. [18] MENG Chuizheng, SEO S, CAO Defu, et al. When physics meets machine learning: A survey of physics-informed machine learning[J]. arXiv: 2203.16797, 2022. doi: 10.48550/arXiv.2203.16797. -