Parallel MoM Using the Six Hundred Thousand Cores on Domestically-made and Many-core Supercomputer
-
摘要:
为实现电磁计算的安全可靠和自主可控,该文基于“天河二号”国产众核超级计算机平台,开展大规模并行矩量法(MoM)的开发工作。为减轻大规模并行计算时计算机集群的通信压力以及加速矩量法积分方程求解,通过分析矩量法电场积分方程离散生成的矩阵具有对角占优特性,提出一种新型LU分解算法,即对角块矩阵选主元LU分解(BDPLU)算法,该算法减少了panel列分解的计算量,更重要的是,完全消除了选主元过程的MPI通信开销。利用BDPLU算法,并行矩量法突破了6×105 CPU核并行规模,这是目前在国产超级计算平台上实现的最大规模的并行矩量法计算,其矩阵求解并行效率可达51.95%。数值结果表明,并行矩量法可准确高效地在国产超级计算平台上解决大规模电磁问题。
Abstract:In order to realize safety, reliability and self-control of electromagnetic computing, the large-scale parallel MoM is studied based on domestically-made many-core supercomputer platform named " Tianhe-2”. A new LU decomposition algorithm named Block Diagonal matrix Pivoting LU decomposition (BDPLU) algorithm, is proposed by analyzing the diagonally dominant characteristics of the matrix generated through dispersing electric field integral equation of MoM, for the purpose of communication pressure reduction to computer cluster and solution acceleration to MoM integral equation during large-scale parallel computation. The BDPLU algorithm reduces the amount of calculation in the process of panel factorization. More importantly, the algorithm completely eliminates MPI communication when pivoting. Using BDPLU algorithm, the maximum number of CPU cores break through 6×105 CPU cores, which is the largest scale of parallel MoM computation in domestically-made and many-core supercomputing platform at present, and the parallel efficiency of solving matrix can reach 51.95%. Numerical results show that parallel MoM can accurately and efficiently solve large-scale electromagnetic field problems on domestic supercomputing platform.
-
1. 引言
到达角(Direction-Of-Arrival, DOA)估计是信号处理的一个重要分支,广泛应用于雷达目标探测、语音通信、无源定位等领域[1-4]。在实际应用中,通常需要通过2维DOA估计获得辐射源的方位角和俯仰角信息。不同的阵列结构会对DOA估计性能产生不同的影响,其中L型阵列结构简单,受到许多研究者的关注。
最初的2维DOA估计算法大多基于2维谱峰搜索[5],计算量大且估计精度不高。文献[6]利用ESPRIT思想分别进行方位角和俯仰角估计,存在角度配对问题。文献[7]通过解析优化获得方位角与仰角间的关系,避免了复杂的计算,但估计精度有所下降。文献[8]将三线性分解运用到2维DOA估计中,该算法无需谱峰搜索,且能够实现参数自动配对,但其中的交替迭代过程仍具有较大的计算量。文献[9]提出了一种自动配对的DOA估计算法,在保证精度的前提下进一步降低了运算复杂度。
然而,当存在相干信号时,上述方法性能出现恶化。针对相干信号,文献[10]将空间平滑(Spatial Smoothing, SS)方法扩展到2维阵列,但是需要复杂的2维谱峰搜索。文献[11]提出了一种互相关矩阵ESPRIT(Cross Correlation Matrix ESPRIT, CCM-ESPRIT)算法,将互相关矩阵划分成多个子阵来消除信号的相干性,但是该方法孔径损失较大。文献[12]在此基础上提出了互相关矩阵相关矢量(Cross Correlation Matrix Correlation Vector Method, CCM-CVM)算法,减少了孔径损失,但也降低了估计精度,该文献同时提出了一种名为CCM-MCVM的改进算法,略微提高了估计精度,但增加了算法复杂度。文献[11]和文献[12]都使用了同一种角度自动配对算法,这种配对算法在多个相干信源条件下极易导致配对错误。文献[13]将稀疏重构运用到L型阵列DOA估计中,利用正交匹配追踪(OMP)法分别估计独立信号和相干信号,有效减小了孔径损失问题,但同时也引入了网格失配误差。
文献[14]针对相干信号DOA估计提出了一种主奇异矢量分析法(Principal-singular-vector Utilization for Modal Analysis, PUMA),具有估计精度高、复杂度低的优点。受文献[14]启发,本文将PUMA算法扩展到L型阵列,提出了L-PUMA算法及其改进算法L-MPUMA,进一步提高了估计精度,减少了孔径损失。本文使用
(⋅)T ,(⋅)H ,(⋅)−1 和(⋅)+ 分别表示转置、共轭转置、逆运算和伪逆运算,E{⋅} ,vec(⋅) ,tr(⋅) ,sum(⋅) ,diag(⋅) 和blkdiag(⋅) 分别表示期望、矢量化操作、矩阵的迹、求和、对角化和分块对角化操作,Im 表示m×m 维单位矩阵,0m×n 表示m×n 维零矩阵,Jm 表示m×m 维置换矩阵,⊗ 表示Kronecker积。2. 信号模型
假设接收阵列是由
x−z 平面内沿x 轴和z 轴的M 元均匀线阵组成的L型阵列,共用原点位置的参考阵元z0 ,同一轴上相邻阵元间距d 等于半波λ/2 ,总共有阵元2M−1 个,阵列结构如图1所示。假设3维空间内有K 个窄带信号入射到L型阵列上,满足K<M 。前Nu 个信号是独立信号,后K−Nu 个相干信号分为Nc 组,组间信号相互独立,独立信号与相干信号组数之和N=Nu+Nc ,第k 个信号的仰角为θk ,方位角为ϕk 。x 轴和z 轴的接收数据可分别表示为X(t)=AxS(t)+N1(t) (1) Z(t)=AzS(t)+N2(t) (2) 式中
S(t)=[s1(t),s2(t),···,sK(t)]T∈CK×1 为入射信号矢量,N1(t) 和N2(t) 表示M 维零均值高斯白噪声,噪声功率为σ2 ,且相互独立。Ax=[a(θ1,ϕ1),a(θ2,ϕ2),···,a(θK,ϕK)]∈CM×K 为x 轴阵列流形,Az=[a(θ1),a(θ2),···,a(θK)]∈CM×K 为z 轴阵列流形。其中a(θi,ϕi)=[1,e−j2πdsin(θi)cos(ϕi)/λ,···,e−j2π(M−1)dsin(θi)cos(ϕi)/λ]T ,a(θi)=[1,e−j2πdcos(θi)/λ,···,e−j2π(M−1)dcos(θi)/λ]T 。3. L-PUMA算法
L-PUMA算法分为3个步骤,首先是降噪处理,然后是仰角和方位角估计,最后是角度配对。
3.1 互协方差矩阵降噪
在L型阵列中,除了原点处的噪声,
x 轴和z 轴的噪声矢量是相互独立的,其噪声协方差为0,而x 轴和z 轴又共用原点处的参考阵元,因此原点位置的噪声协方差为σ2 。噪声协方差矩阵可表示为E{N1(t)N2H(t)}=σ2×blkdiag(1,0M−1,M−1)=Q0 (3) 易得,接收数据的互协方差矩阵为
RZ,X=E{Z(t)XH(t)}=AzRSAHx+Q0=US1ΩS1VHS1+Un1Ωn1VHn1 (4) 式中
ΩS1 为大奇异值,Ωn1 为小奇异值,US1 ,VS1 分别为大奇异值对应的左、右奇异矢量矩阵,Un1 ,Vn1 分别为小奇异值对应的左、右奇异矢量矩阵。同理,接收数据的自协方差矩阵RZ=E{Z(t)ZH(t)}=AzRSAHz+σ2IM=US2ΩS2UHS2+Un2Ωn2UHn2 (5) 式中
ΩS2 为大特征值,Ωn2 为小特征值,US2 和Un2 分别为大特征值和小特征值对应的特征矢量矩阵。许多文献选择使用互协方差来做降噪处理[11,12],但没有考虑到互协方差共同参考阵元而引入的噪声矩阵
Q0 ,实际上Q0 会比σ2IM 带来更大的估计误差。将式(5)对应的自协方差矩阵左乘UHn2 ,右乘Un2 ,有UHn2(AzRSAHz+σ2IM)Un2=UHn2US2ΩS2UHS2Un2+σ2IM−K=σ2IM−K (6) 同时减去
σ2IM−K ,有UHn2AzRSAHzUn2=0 ,即UHn2Az=0 。同理,将式(4)对应的互协方差矩阵左乘
UHn1 ,右乘Vn1 ,有UHn1(AzRSAHx+Q0)Vn1=UHn1US1ΩS1VHS1Vn1+UHn1Un1Ωn1VHn1Vn1=Ωn1 (7) 将式(7)第1和第3行相减,有
UHn1AzRSAHxVn1=Ωn1−UHn1Q0Vn1≠0 ,所以有UHn1Az≠0 。可知阵列流形Az 与噪声子空间Un2 正交,而与噪声子空间Un1 不正交。在实际情况中,快拍数
L 为有限值,此时互协方差矩阵近似表示为ˆRZ,X=ZXH/L=AzRSAHx+Q0+Q1(σ2,L) (8) 式中,
L 为快拍数,Z 和X 均为M×L 维矢量,Q1(σ2,L) 是σ2 和L 的函数,包含了有限快拍产生的误差以及信号噪声间的互相关成分。同理,自协方差矩阵近似表示为ˆRZ=ZZH/L=AzRSAHz+σ2IM+Q2(σ2,L) (9) 式中
Q2(σ2,L) 包含了相同的噪声成分。易知,当快拍数有限时,噪声子空间Un1 ,Un2 与阵列流形Az 均不正交。若选取互协方差矩阵进行后续的DOA估计,则需要减少误差的影响,其中Q1 和Q2 为随机误差,无法消除,而Q0 只需要估计出噪声功率即可进行消除。根据式(5)对
RZ 进行特征值分解得到噪声功率的估计值ˆσ2=sum(diag(Ωn2))/(M−N) ,最后可得降噪后的互协方差矩阵R=ˆRZ,X−ˆQ0 ,其中ˆQ0 为Q0 的估计值。3.2 仰角和方位角估计
L-PUMA算法需要预先知道相干信号的组数
N 和总数K ,可以根据文献[15]所提的改进盖氏圆算法获得,在估计出N 和K 之后,进行仰角和方位角的估计。对R 进行奇异值分解,得到R=USΩSVHS+UnΩnVHn (10) ΩS 为N 个大奇异值,Ωn 为M−N 个小奇异值,ΩS=diag(λ1,λ2,···,λN) ,Ωn=diag(λN+1,λN+2,···,λM) 。US 和VS 为大奇异值对应的左、右主奇异矢量矩阵,Un 和Vn 为小奇异值对应的噪声奇异矢量矩阵。不同于非相干条件,此时界定信号子空间和噪声子空间的不再是信号个数K ,而是信号组数N 。由文献[16]可知,相干条件下信号子空间和阵列流形间的关系可以表示为US=AzG1 (11) VS=AxG2 (12) 式中,
G1 ,G2 均为K×N 维变换矩阵,其秩为N 。先对仰角
θ 进行估计,构造以zi=e−j2πdcos(θi)/λ,i=1,2,···,K 为根的K 次方程f(z)=K∏i=1(z−zi)=0 (13) 将式(13)展开成
f(z)=b0zK+b1zK−1+···+bK=0 (14) 不妨令
b0=1 ,只需要确定多项式系数b=[b1,b2,···,bK]T ,即可通过方程求根得到信号的仰角。构造M×(M−K) 维Toeplitz矩阵B B=[bKbK−1···b00000bKbK−1···b000⋱⋱⋱⋱⋱000bKbK−1···b0]H (15) 对于
i=1,2, ··· ,K ,有BHa(θi)=f(zi)[1 zi ··· zi(M−K−1)]T=0(M−K)×1 (16) 因此,
BHAz=0(M−K)×K ,可知B 是阵列流形Az 的正交补。又因为US=AzG1 ,所以有BHUS=0(M−K)×N (17) 将
US 写成US=[u1,u2,···,uN] ,其中ui 为第i 个主奇异矢量,有BHui=Fib−gi=0(M−K)×1 (18) 式中
Fi=[[ui]K[ui]K−1⋯[ui]1[ui]K+1[ui]K⋯[ui]2⋮⋮⋱⋮[ui]M−1[ui]M−2⋯[ui]M−K] (19) gi=−[[ui]K+1,[ui]K+2,⋯,[ui]M]T (20) [ui]K 表示矢量ui 的第K 个元素。对式(17)进行矢量化vec(BHUS)=Fb−g=0(M−K)N×1 (21) 式中
F=[F1T,F2T,···,FNT]T ,g=[g1T,g2T,···,gNT]T 。在误差条件下,式(21)可以表示为ˆFb≈ˆg (22) ˆF 和ˆg 是F 和g 的测量值。用加权最小二乘法(Weighted Least Squares, WLS)来求解b ,即b=argminbˆeHWˆe (23) 式中
ˆe=ˆFb−ˆg=(IN⊗BH)ˆuS (24) W=(E{ˆeˆeH})−1 (25) ˆuS=vec(ˆUS) 为矢量化后的主特征矢量。容易得到式(23)的解为b=(ˆFHWˆF)−1ˆFHWˆg (26) 然而
W 又是b 的函数,因此不能直接用式(26)求解b ,需要对W 作简化。文献[14]给出了W 的近似解ˆW=D⊗(BHB)−1 (27) 式中
D=diag((λ1−δ2)2λ1,(λ2−δ2)2λ2,···,(λN−δ2)2λN) (28) δ2=1M−NM∑i=N+1λi (29) 至此
ˆb 可以通过交替迭代求得。首先通过式(22)的最小二乘解ˆb0=ˆF†ˆg 确定ˆb 的初始值,再代入式(27)初始化ˆW ,然后将ˆW 代入式(23)更新ˆb ,最后求解线性方程即可得到信号的仰角估计值{ˆθi}Ki=1 。同理,对方位角
ϕ 进行估计,构造以xi=e−j2πdsin(θi)cos(ϕi)/λ,i=1,2,···,K 为根的K 次方程g(z)=c0xK+c1xK−1+···+cK=0 (30) 只需要确定多项式系数
c=[c1,c2,···,cK]T ,即可得到信号的方位角。构造M×(M−K) 维Toeplitz矩阵C=[cKcK−1···c00000cKcK−1···c000⋱⋱⋱⋱⋱000cKcK−1···c0]H (31) 易知
CHVS=0(M−K)×K ,因此只需要将式(22)中的US 替换成VS ,再进行相同的操作,即可确定系数ˆc ,最后求解以ˆc 为系数的方程得到K 个根{xi}Ki=1 。需要注意的是,不能通过xi 直接估计方位角{ˆϕi}Ki=1 ,因为xi=e−j2πdsin(θi)cos(ϕi)/λ ,与ˆθi 之间存在配对问题,需要通过配对算法得到正确的配对次序。3.3 角度配对
通过仰角估计值
{ˆθi}Ki=1 可以得到ˆAz ,通过K 个根{xi}Ki=1 可以得到ˆAx 。然而在上述算法中,仰角和方位角是分别估计得到的,不存在关联,即ˆAz 和ˆAx 之间存在顺序模糊。易知自协方差矩阵与互协方差矩阵中都含有信号协方差RS ,通过此共有信息可实现角度配对。将ˆAz 和ˆAx 分别表示为ˆAz=AzE1 (32) ˆAx=AxE2 (33) E1 和E2 为列变换矩阵。易知,去噪后的自协方差矩阵ˉRZ ,ˉRX 以及互协方差矩阵R 中都含有信号协方差矩阵RS ,其中ˉRZ=ZZH/L−ˆσ2IM ,ˉRX=XXH/L−ˆσ2IM 。通过式(34)求出RS RS1=ˆAz+ˉRZ(ˆAz+)H=E1TRSE1,RS2=ˆAx+ˉRX(ˆAx+)H=E2TRSE2RS3=ˆAx+RH(ˆAz+)H=E2TRSE1,RS4=ˆAz+R(ˆAx+)H=E1TRSE2} (34) 最小化如式(35)代价函数
p ,可以得到E1 ,E2 p=minE1,E2‖E2RS3E1T−E1RS1E1T+E1RS4E2T−E2RS2E2T‖F (35) 不妨令
H=E2TE1 ,其中H 为列变换矩阵,在求解过程中需要加入本身的结构约束,即H 的每行只有一个元素为1,其余元素为0。式(35)可进一步简化为p=minH‖RS3−HRS1+HRS4H−RS2H‖F (36) 由式(32)和式(33)可知,
ˆAz 与ˆAxH 是完全匹配的。因此只需最小化代价函数p ,求出变换矩阵H 即可完成角度配对。相比于文献[17]中的PSCM配对算法,本文所提的配对算法精度更高。3.4 L-PUMA算法步骤
步骤 1 首先求出降噪后的互协方差矩阵
R ;步骤 2 将
US 按照式(19)和式(20)的形式构造矩阵F 和g ,得到b 的初始值ˆb0=ˆF+ˆg ,再通过式(27)和式(26)的交替迭代优化b ,然后求解线性方程式(14)计算出K 个根{zi}Ki=1 ,得到仰角的估计值ˆθi=arccos(−λ2πd∠zi) ;步骤 3 将步骤2中的
US 替换为VS ,重复步骤2的迭代操作,得到c ,再求解式(30)计算出K 个根{xi}Ki=1 ,xi 中同时包含了仰角和方位角的信息;步骤 4 利用
{zi}Ki=1 和{xi}Ki=1 得到估计的阵列流形ˆAz 和ˆAx ,再通过最小化式(36)求出变换矩阵H ,最后通过H 得到配对后的角度{ˆθi}Ki=1 ,{ˆϕi}Ki=1 。4. 改进的L-PUMA(L-MPUMA)算法
L-PUMA算法的估计精度由线性方程
ˆFb≈ˆg 决定,ˆF 的维数越大,方程的个数越多,则b 的计算精度越高。当信号完全相干时,主奇异矢量的个数减至1,大幅降低了线性方程的个数,算法性能下降严重,L-MPUMA通过构造反向主奇异矢量UR=JMUS∗ 来进一步扩大ˆF 的维数,易知BH[US,UR]=BHAz[G,ϕ−(M−1)G∗]=0(M−K)×2N (37) 式中
ϕ=diag([e−j2πdcos(θ1)/λ,e−j2πdcos(θ2)/λ,···,e−j2πdcos(θK)/λ]) ,令USR=[US,UR] 为增广主奇异矢量,可知B 与USR 正交,因此式(22)可扩展为ˆFSRb≈ˆgSR (38) 式中
ˆFSR=[ˆFT,(JM−KˆF∗)T]T ,ˆgSR=[ˆgT,(JM−Kˆg∗)T]T 。式(38)的解为b=argminbˆeSRHWSRˆeSR (39) 式中
ˆeSR=(I2N⊗BH)ˆuSR ,WSR=(E{ˆeSRˆeSRH})−1 。ˆuSR=vec(ˆUSR) 为矢量化后的增广主特征矢量,WSR 为2N 个矩阵组成的块对角阵。由第3节的推导可知式(39)可进一步写为b=(ˆFSRHWSRˆFSR)−1ˆFSRHWSRˆgSR (40) WSR 中的第N+i 个块矩阵为BHE{(JMˆui∗)(JMˆui∗)H}B≈BHJM(E{ˆuiˆuiH})∗JMB≈λiσ2L(λi−σ2)2BHB (41) 与第
i 个块矩阵完全相同。因此可以得到WSR 的近似解ˆWSR=DSR⊗(BHB)−1 (42) 式中
DSR=blkdiag(D,D) (43) 然后分别通过
US 和VS 构造增广主特征矢量USR 和VSR ,最后通过迭代以及角度配对估计出仰角和方位角。5. 多目标处理能力分析
为了方便描述,将文献[11]所提算法称为CCM算法,文献[12]所提的两种算法称为CVM和MCVM算法,文献[13]所提算法称为OMP算法。下面对L-PUMA算法和L-MPUMA算法的测向能力进行比较,在L-PUMA算法中,
b 由式ˆFb≈ˆg 确定,其中ˆF 是(M−K)N×K 矩阵,相当于通过(M−K)N 个方程确定K 个未知数,当(M−K)N<K 时,b 存在较大的求解误差,因此需要满足(M−K)N≥K ,即最大可分辨信号数kmax=NN+1M 。同理,对于L-MPUMA算法,b 由式ˆFSRb≈ˆgSR 确定,其中ˆFSR 是2(M−K)N×K 维矩阵,因此最大可分辨信号数kmax=2N2N+1M ,相比于L-PUMA, L-MPUMA算法提高了最大可分辨信号数,并且本文提出的两种算法较以往算法都提高了信号分辨数。6. 仿真实验
将本文提出的L-PUMA, L-MPUMA算法与CCM, CVM, MCVM以及OMP算法进行比较。假设接收阵元噪声为高斯白噪声,噪声间相互独立,每次仿真均进行1000次蒙特卡罗实验。
实验1:配对算法性能比较
为了验证本文所提配对算法的有效性,将L-PUMA算法中的配对环节用文献[17]中的PSCM配对算法替代,简称为L-PUMA2算法。同样地,将L-MPUMA算法中的配对环节用PSCM替代,称为L-MPUMA2算法。假设有3个信号入射到17个阵元构成的L型阵列上,入射信号的仰角、方位角分别为
(65∘,120∘) ,(80∘,105∘) 和(95∘,90∘) 。前两个信号相干,相干系数为[1,0.4ejπ/3] ,第3个信号独立,快拍数为200。由图2可知,当−5dB<SNR<5dB 时,L-PUMA算法的RMSE明显低于L-PUMA2, L-MPUMA算法的RMSE明显低于L-MPUMA2,可见改进的配对算法提升了算法性能。再分析临近目标对配对算法性能的影响,假设
SNR=10dB ,快拍数为200,阵元数保持不变。有两个相干信号入射到接收阵列上,第1个信号的仰角、方位角为(50∘,80∘) ,第2个信号的仰角、方位角为(50∘+Δα,80∘−Δα) ,Δα 表示角度间隔,其变化范围为1∘∼10∘ ,步长为0.5∘ 。如图3所示,随着角度间隔的增加,入射信号的空间分辨率越来越大,配对成功率随之升高,其中经过配对算法改进的L-PUMA的成功率要高于L-PUMA2,同理,L-MPUMA的成功率也高于L-MPUMA2。实验2:信噪比变化对算法性能的影响
假设有3个信号入射到17个阵元构成的L型阵列上,入射信号的仰角、方位角分别为
(65∘,120∘) ,(80∘,105∘) 和(95∘,90∘) 。前两个信号相干,相干系数为[1,0.4ejπ/3] ,第3个信号独立,快拍数为200。由图4可知,当SNR<−5dB 时,CCM算法的RMSE最低,当SNR>−5dB 时,L-MPUMA算法的RMSE最低,L-PUMA算法次之,而CVM和MCVM的RMSE均较大,OMP算法的性能在所有算法中处于中间水平。仅改变入射信号之间的相干性,假设信号完全相干,相干系数为
[1,0.3ejπ/10,0.8e−jπ/6] 。由图5可知,OMP算法在低信噪比条件下性能下降严重,L-PUMA算法的RMSE整体升高,性能完全被CCM算法超越,这是由于信号的完全相干导致了线性方程个数的减少,因此估计精度下降。而L-MPUMA算法仍能保持很好的性能,当SNR>−5dB 时,其RMSE低于任何一种算法。实验3:快拍数变化对算法性能的影响
设
SNR=10dB ,快拍数从100增加至1000,其余参数均与实验2相同。如图6所示,当信号部分相干时,可以看出算法受快拍数的影响不大,RMSE变化较为平缓,各算法的性能由差到好排序依次是:CVM, MCVM和CCM, L-PUMA, OMP, L-MPUMA。仅改变信号相干性,将部分相干的信号改成完全相干。如图7所示,当信号完全相干时,所有算法的RMSE均被抬高,其中L-PUMA的RMSE与CVM和MCVM相当,性能下滑严重;CCM和OMP算法的性能处于中间水平;而L-MPUMA的RMSE则最低,性能最好。可见信号的相干越大,解相干算法的性能越差,L-PUMA对于信号的相干程度十分敏感,而L-MPUMA受到的影响则较小,鲁棒性较好。
实验4:多目标处理能力
假设
SNR=10dB ,快拍数为200,共有4个相干信号入射到11个阵元组成的L型阵列上,仰角、方位角分别为(65∘,115∘) ,(80∘,100∘) ,(95∘,85∘) 和(110∘,70∘) 。假设4个信号完全相干,都属于同一组相干信号,即N=1 ,如图8所示,星号代表目标的真实位置,可以看出L-MPUMA算法估计出的角度与真实角度比较接近,而L-PUMA算法则出现估计错误,估计值严重偏离真实值。这是因为在N=1 ,M=6 的条件下,L-PUMA最多可处理的信号数为kmax=NN+1M=3 , L-MPUMA可处理的信号数为kmax=2N2N+1M=4 。假设4个信号部分相干,分为两组相干信号,即
N=2 ,且每组信号数为2个,仰角和方位角保持不变。从理论上分析,L-PUMA最多可处理的信号数为4个,L-MPUMA可处理的信号数为4.8个,向下取整为4个。如图9所示,两种算法估计出的目标均接近真实目标,其中L-MPUMA的偏差更小,L-PUMA的偏差稍大但也能做到准确估计。与图8中信号完全相干的情况相比,此时算法的分辨率有很大提升。在其他条件不变的情况下,再增加一个独立信号,新增的仰角、方位角为
(125∘,55∘) ,此时共有3组相干信号,即N=3 ,信号总数为5个,阵元数仍保持11个。由分析可知L-PUMA最多可处理4个信号,L-MPUMA最多可处理5个信号。如图10所示,L-MPUMA算法仍可以得到和真实目标较为接近的结果,而L-PUMA算法则完全失效,无法显示出目标。7. 结论
本文针对L型阵列相干信号DOA估计问题,提出了两种解相干算法:L-PUMA和L-MPUMA算法,较大程度提高了估计精度和最大可分辨信号数。虽然L-PUMA算法在信号完全相干条件下性能下降比较严重,但当信号部分相干时性能良好。L-MPUMA算法则对信号的相干程度不敏感,进一步提高了精度和鲁棒性。
-
表 1 CALU算法与BDPLU算法矩阵求解时间对比
FT2000+核数 矩阵求解时间(s) 并行效率(%) CALU BDPLU CALU BDPLU 2000 796.54 742.57 100 100 3000 567.78 518.68 93.53 95.44 4000 463.93 421.12 85.85 88.17 5000 386.89 338.24 82.35 87.82 10000 226.57 187.83 70.31 79.07 15000 172.91 139.05 61.42 71.20 20000 133.97 118.38 59.46 62.73 40000 72.83 64.61 54.68 57.47 表 2 BDPLU算法求解矩阵的加速比和并行效率
FT2000+核数 矩阵求解时间(s) 加速比 并行效率(%) 9600 29183.33 1 100 48000 6336.53 4.61 92.11 96000 3501.73 8.33 83.34 192000 2035.35 14.34 71.69 240000 1764.53 16.54 66.16 336000 1328.13 21.97 62.78 384000 1227.91 23.77 59.42 432000 1133.64 25.74 57.21 480000 1043.45 27.97 55.94 504000 997.94 29.24 55.70 552000 937.82 31.12 54.12 600000 898.81 32.49 51.95 -
HARRINGTION R F. Field Computation by Moment Methods[M]. New York; IEEE Press, 1993. 王长清. 现代计算电磁学基础[M]. 北京: 北京大学出版社, 2005: 116–157.WANG Changqing. Computational Advanced Electromagnetics[M]. Beijing: PeKing University Press, 2005: 116–157. ZHANG Yu and SARKAR T K. Parallel Solution of Integral Equation Based EM Problems in the Frequency Domain [M].Hoboken, USA: Wiley-IEEE, 2009: 107–136. 张玉, 赵勋旺, 陈岩, 等. 计算电磁学中的大规模并行矩量法[M]. 西安: 西安电子科技大学出版社, 2016: 11210.ZHANG Yu, ZHAO Xunwang, CHEN Yan, et al. Massively Parallel Method of Moment in Computational Electromagnetics[M].Xi’an: Xidian University Press, 2016: 11210. 林中朝, 张爽, 王星, 等. 高阶矩量法在国产超级计算机上的并行性能[J]. 微波学报, 2014, 30(S1): 44–47LIN Zhongchao, ZHANG Shuang, WANG Xing, et al. Parallel performance of higher-order MoM on a domestically-made supercomputer[J]. Journal of Microwaves, 2014, 30(S1): 44–47 林中朝, 陈岩, 张玉, 等. 国产CPU平台中并行高阶矩量法研究[J]. 西安电子科技大学学报, 2015, 42(3): 43–47 doi: 10.3969/j.issn.1001-2400.2015.03.008LIN Zhongchao, CHEN Yan, ZHANG Yu, et al. Study of the parallel higher-order MoM on a domestically-made CPU platform[J]. Journal of Xidian University, 2015, 42(3): 43–47 doi: 10.3969/j.issn.1001-2400.2015.03.008 ZHANG Yu, LIN Zhongchao, ZHAO Xunwang, et al. Performance of a massively parallel higher-order method of moment code using thousands of CPUs and its applications[J]. IEEE Transactions on Antenna Propagation, 2014, 62(12): 6317–6324 doi: 10.1109/TAP.2014.2361135 ZHAO Xunwang, CHEN Yan, ZHANG Huanhuan, et al. A New Decomposition Solver for Complex Electromagnetic Problems[J]. IEEE Antennas & Propagation Magazine, 2017, 59(3): 131–140 doi: 10.1109/MAP.2017.2687119 CHEN Yan, ZHANG Yu, ZHANG Guanghui, et al. Hybrid MIC/CPU parallel implementation of MoM on MIC cluster for electromagnetic problems[J]. IEICE Transactions on Electronics, 2016, 99(7): 735–743 doi: 10.1587/transele.E99.C.735 CHEN Yan, ZHANG Guanghui, LIN Zhongchao, et al. Solution of EM problems using hybrid parallel MIC/CPU implementation of higher-order MoM[C]. IEEE International Symposium on Microwave, Antenna, Propagation, and Emc Technologies. Shanghai, China, 2016: 789–791. 左胜, 陈岩, 张玉, 等. 一种可扩展异构并行核外高阶矩量法[J]. 西安电子科技大学学报, 2017, 44(1): 146–151 doi: 10.3969/j.issn.1001-2400.2017.01.026ZUO Sheng, CHEN Yan, ZHANG Yu, et al. Study of the scalable heterogeneous parallel out-of-core higher order method of moments[J]. Journal of Xidian University, 2017, 44(1): 146–151 doi: 10.3969/j.issn.1001-2400.2017.01.026 CHEN Yan, ZUO Sheng, ZHANG Yu, et al. Large-scale parallel method of moments on CPU/MIC heterogeneous clusters[J]. IEEE Transactions on Antennas & Propagation, 2017, 65(7): 3782–3787 doi: 10.1109/TAP.2017.2700871 TANG Min, ZHAO Jieyi, TONG Ruofeng, et al. GPU accelerated convex hull computation[J]. Computers & Graphics, 2012, 36(5): 498–506 doi: 10.1016/j.cag.2012.03.015 陈岩. 高性能矩量法及其在复杂目标电磁模拟中的应用[D]. [博士论文], 西安电子科技大学, 2017: 86–91.Chen Yan. High performance method of moments and its application in electromagnetic simulation of complex targets[D]. [Ph.D. dissertation], Xidian University, 2017: 86–91. ZHANG Yu, CHEN Yan, ZHANG Guanghui, et al. A highly efficient communication avoiding LU algorithm for Methods of Moments[C]. IEEE International Symposium on Antennas and Propagation & Usnc/ursi National Radio Science Meeting, Vancouver, Canada, 2015: 1672–1673. Intel® Developer Zone: Intel® Math Kernel Library [OL]. https://software.intel.com/en-us/forums/intel-math-kernel-library/, 2018. 徐晓飞, 曹祥玉, 高军, 等. 基于矩量法的电大目标RCS核外并行计算[J]. 电子与信息学报, 2011, 33(3): 758–762 doi: 10.3724/SP.J.1146.2010.00519XU Xiaofei, CAO Xiangyu, GAO Jun, et al. Parallel out-of-core calculation of electrically large objects’ RCS based on MoM[J]. Journal of Electronics &Information Technology, 2011, 33(3): 758–762 doi: 10.3724/SP.J.1146.2010.00519 马骥, 龚书喜, 王兴, 等. 一种快速计算目标宽带雷达截面的电磁算法[J]. 西安电子科技大学学报, 2012, 39(4): 98–102 doi: 10.3969/j.issn.1001-2400.2012.04.018MA Ji, GONG Shuxi, WANG Xing, et al. Fast computation of the wide-band radar cross section of arbitrary objects[J]. Journal of Xidian University, 2012, 39(4): 98–102 doi: 10.3969/j.issn.1001-2400.2012.04.018 国家超级计算广州中心: 产品中心[OL]. http://www.nscc-gz.cn/Product/HighPerformanceComputingService/ServiceCharacteristics.html, 2018.6. 期刊类型引用(2)
1. 李齐衡,孙溶辰,孙志国. 基于矩阵重构和酉变换的DOA估计. 应用科技. 2024(01): 120-129 . 百度学术
2. 王绪虎,冯洪浩,孙高利,贺劲松. L型互质阵的虚拟共轭插值二维DOA估计方法. 信号处理. 2024(10): 1834-1845 . 百度学术
其他类型引用(6)
-