Loading [MathJax]/jax/output/HTML-CSS/jax.js
高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于国产众核超级计算机的6×105核并行矩量法

顾宗静 吴昊翔 赵勋旺 林中朝 张玉 张崎

唐晓杰, 何明浩, 冯明月, 陈昌孝, 韩俊. 基于主奇异矢量的L型阵列相干信号二维DOA估计方法[J]. 电子与信息学报, 2020, 42(11): 2579-2586. doi: 10.11999/JEIT190455
引用本文: 顾宗静, 吴昊翔, 赵勋旺, 林中朝, 张玉, 张崎. 基于国产众核超级计算机的6×105核并行矩量法[J]. 电子与信息学报, 2019, 41(4): 845-850. doi: 10.11999/JEIT180562
Xiaojie TANG, Minghao HE, Mingyue FENG, Changxiao CHEN, Jun HAN. Two-dimensional DOA Estimation Method for L-shaped Array of Coherent Signals Based on Main Singular Vector[J]. Journal of Electronics & Information Technology, 2020, 42(11): 2579-2586. doi: 10.11999/JEIT190455
Citation: Zongjing GU, Haoxiang WU, Xunwang ZHAO, Zhongchao LIN, Yu ZHANG, Qi ZHANG. Parallel MoM Using the Six Hundred Thousand Cores on Domestically-made and Many-core Supercomputer[J]. Journal of Electronics & Information Technology, 2019, 41(4): 845-850. doi: 10.11999/JEIT180562

基于国产众核超级计算机的6×105核并行矩量法

doi: 10.11999/JEIT180562
基金项目: 国家重点研发计划(2017YFB0202102, 2016YFE0121600),中国博士后科学基金(2017M613068)
详细信息
    作者简介:

    顾宗静:男,1989年生,博士生,研究方向为计算电磁学、大规模并行矩量法、区域分解算法

    吴昊翔:男,1995年生,硕士生,研究方向为计算电磁学、大规模并行矩量法

    赵勋旺:男,1983年生,副教授,研究方向为大型机载天线阵列分析

    林中朝:男,1988年生,讲师,研究方向为计算电磁学

    张玉:男,1978年生,教授,研究方向为计算电磁学、大规模并行算法

    通讯作者:

    赵勋旺 xwzhao@mail.xidian.edu.cn

  • 中图分类号: TN820

Parallel MoM Using the Six Hundred Thousand Cores on Domestically-made and Many-core Supercomputer

Funds: The National Key Research and Development Program of China (2017YFB0202102, 2016YFE0121600), The China Postdoctoral Science Foundation (2017M613068)
  • 摘要:

    为实现电磁计算的安全可靠和自主可控,该文基于“天河二号”国产众核超级计算机平台,开展大规模并行矩量法(MoM)的开发工作。为减轻大规模并行计算时计算机集群的通信压力以及加速矩量法积分方程求解,通过分析矩量法电场积分方程离散生成的矩阵具有对角占优特性,提出一种新型LU分解算法,即对角块矩阵选主元LU分解(BDPLU)算法,该算法减少了panel列分解的计算量,更重要的是,完全消除了选主元过程的MPI通信开销。利用BDPLU算法,并行矩量法突破了6×105 CPU核并行规模,这是目前在国产超级计算平台上实现的最大规模的并行矩量法计算,其矩阵求解并行效率可达51.95%。数值结果表明,并行矩量法可准确高效地在国产超级计算平台上解决大规模电磁问题。

  • 到达角(Direction-Of-Arrival, DOA)估计是信号处理的一个重要分支,广泛应用于雷达目标探测、语音通信、无源定位等领域[1-4]。在实际应用中,通常需要通过2维DOA估计获得辐射源的方位角和俯仰角信息。不同的阵列结构会对DOA估计性能产生不同的影响,其中L型阵列结构简单,受到许多研究者的关注。

    最初的2维DOA估计算法大多基于2维谱峰搜索[5],计算量大且估计精度不高。文献[6]利用ESPRIT思想分别进行方位角和俯仰角估计,存在角度配对问题。文献[7]通过解析优化获得方位角与仰角间的关系,避免了复杂的计算,但估计精度有所下降。文献[8]将三线性分解运用到2维DOA估计中,该算法无需谱峰搜索,且能够实现参数自动配对,但其中的交替迭代过程仍具有较大的计算量。文献[9]提出了一种自动配对的DOA估计算法,在保证精度的前提下进一步降低了运算复杂度。

    然而,当存在相干信号时,上述方法性能出现恶化。针对相干信号,文献[10]将空间平滑(Spatial Smoothing, SS)方法扩展到2维阵列,但是需要复杂的2维谱峰搜索。文献[11]提出了一种互相关矩阵ESPRIT(Cross Correlation Matrix ESPRIT, CCM-ESPRIT)算法,将互相关矩阵划分成多个子阵来消除信号的相干性,但是该方法孔径损失较大。文献[12]在此基础上提出了互相关矩阵相关矢量(Cross Correlation Matrix Correlation Vector Method, CCM-CVM)算法,减少了孔径损失,但也降低了估计精度,该文献同时提出了一种名为CCM-MCVM的改进算法,略微提高了估计精度,但增加了算法复杂度。文献[11]和文献[12]都使用了同一种角度自动配对算法,这种配对算法在多个相干信源条件下极易导致配对错误。文献[13]将稀疏重构运用到L型阵列DOA估计中,利用正交匹配追踪(OMP)法分别估计独立信号和相干信号,有效减小了孔径损失问题,但同时也引入了网格失配误差。

    文献[14]针对相干信号DOA估计提出了一种主奇异矢量分析法(Principal-singular-vector Utilization for Modal Analysis, PUMA),具有估计精度高、复杂度低的优点。受文献[14]启发,本文将PUMA算法扩展到L型阵列,提出了L-PUMA算法及其改进算法L-MPUMA,进一步提高了估计精度,减少了孔径损失。本文使用()T, ()H, ()1()+分别表示转置、共轭转置、逆运算和伪逆运算,E{}, vec(), tr(), sum(), diag()blkdiag()分别表示期望、矢量化操作、矩阵的迹、求和、对角化和分块对角化操作,Im表示m×m维单位矩阵,0m×n表示m×n维零矩阵,Jm表示m×m维置换矩阵,表示Kronecker积。

    假设接收阵列是由xz平面内沿x轴和z轴的M元均匀线阵组成的L型阵列,共用原点位置的参考阵元z0,同一轴上相邻阵元间距d等于半波λ/2,总共有阵元2M1个,阵列结构如图1所示。假设3维空间内有K个窄带信号入射到L型阵列上,满足K<M。前Nu个信号是独立信号,后KNu个相干信号分为Nc组,组间信号相互独立,独立信号与相干信号组数之和N=Nu+Nc,第k个信号的仰角为θk,方位角为ϕk

    图 1  L型阵列几何结构

    x轴和z轴的接收数据可分别表示为

    X(t)=AxS(t)+N1(t) (1)
    Z(t)=AzS(t)+N2(t) (2)

    式中S(t)=[s1(t),s2(t),···,sK(t)]TCK×1为入射信号矢量,N1(t)N2(t)表示M维零均值高斯白噪声,噪声功率为σ2,且相互独立。Ax=[a(θ1,ϕ1),a(θ2,ϕ2),···,a(θK,ϕK)]CM×Kx轴阵列流形,Az=[a(θ1),a(θ2),···,a(θK)]CM×Kz轴阵列流形。其中a(θi,ϕi)=[1,ej2πdsin(θi)cos(ϕi)/λ,···,ej2π(M1)dsin(θi)cos(ϕi)/λ]T, a(θi)=[1,ej2πdcos(θi)/λ,···,ej2π(M1)dcos(θi)/λ]T

    L-PUMA算法分为3个步骤,首先是降噪处理,然后是仰角和方位角估计,最后是角度配对。

    在L型阵列中,除了原点处的噪声,x轴和z轴的噪声矢量是相互独立的,其噪声协方差为0,而x轴和z轴又共用原点处的参考阵元,因此原点位置的噪声协方差为σ2。噪声协方差矩阵可表示为

    E{N1(t)N2H(t)}=σ2×blkdiag(1,0M1,M1)=Q0 (3)

    易得,接收数据的互协方差矩阵为

    RZ,X=E{Z(t)XH(t)}=AzRSAHx+Q0=US1ΩS1VHS1+Un1Ωn1VHn1 (4)

    式中ΩS1为大奇异值,Ωn1为小奇异值,US1, VS1分别为大奇异值对应的左、右奇异矢量矩阵,Un1, Vn1分别为小奇异值对应的左、右奇异矢量矩阵。同理,接收数据的自协方差矩阵

    RZ=E{Z(t)ZH(t)}=AzRSAHz+σ2IM=US2ΩS2UHS2+Un2Ωn2UHn2 (5)

    式中ΩS2为大特征值,Ωn2为小特征值,US2Un2分别为大特征值和小特征值对应的特征矢量矩阵。

    许多文献选择使用互协方差来做降噪处理[11,12],但没有考虑到互协方差共同参考阵元而引入的噪声矩阵Q0,实际上Q0会比σ2IM带来更大的估计误差。将式(5)对应的自协方差矩阵左乘UHn2,右乘Un2,有

    UHn2(AzRSAHz+σ2IM)Un2=UHn2US2ΩS2UHS2Un2+σ2IMK=σ2IMK (6)

    同时减去σ2IMK,有UHn2AzRSAHzUn2=0,即UHn2Az=0

    同理,将式(4)对应的互协方差矩阵左乘UHn1,右乘Vn1,有

    UHn1(AzRSAHx+Q0)Vn1=UHn1US1ΩS1VHS1Vn1+UHn1Un1Ωn1VHn1Vn1=Ωn1 (7)

    将式(7)第1和第3行相减,有UHn1AzRSAHxVn1=Ωn1UHn1Q0Vn10,所以有UHn1Az0。可知阵列流形Az与噪声子空间Un2正交,而与噪声子空间Un1不正交。

    在实际情况中,快拍数L为有限值,此时互协方差矩阵近似表示为

    ˆRZ,X=ZXH/L=AzRSAHx+Q0+Q1(σ2,L) (8)

    式中,L为快拍数,ZX均为M×L维矢量,Q1(σ2,L)σ2L的函数,包含了有限快拍产生的误差以及信号噪声间的互相关成分。同理,自协方差矩阵近似表示为

    ˆRZ=ZZH/L=AzRSAHz+σ2IM+Q2(σ2,L) (9)

    式中Q2(σ2,L)包含了相同的噪声成分。易知,当快拍数有限时,噪声子空间Un1, Un2与阵列流形Az均不正交。若选取互协方差矩阵进行后续的DOA估计,则需要减少误差的影响,其中Q1Q2为随机误差,无法消除,而Q0只需要估计出噪声功率即可进行消除。

    根据式(5)对RZ进行特征值分解得到噪声功率的估计值ˆσ2=sum(diag(Ωn2))/(MN),最后可得降噪后的互协方差矩阵R=ˆRZ,XˆQ0,其中ˆQ0Q0的估计值。

    L-PUMA算法需要预先知道相干信号的组数N和总数K,可以根据文献[15]所提的改进盖氏圆算法获得,在估计出NK之后,进行仰角和方位角的估计。对R进行奇异值分解,得到

    R=USΩSVHS+UnΩnVHn (10)

    ΩSN个大奇异值,ΩnMN个小奇异值,ΩS=diag(λ1,λ2,···,λN), Ωn=diag(λN+1,λN+2,···,λM)USVS为大奇异值对应的左、右主奇异矢量矩阵,UnVn为小奇异值对应的噪声奇异矢量矩阵。不同于非相干条件,此时界定信号子空间和噪声子空间的不再是信号个数K,而是信号组数N。由文献[16]可知,相干条件下信号子空间和阵列流形间的关系可以表示为

    US=AzG1 (11)
    VS=AxG2 (12)

    式中,G1, G2均为K×N维变换矩阵,其秩为N

    先对仰角θ进行估计,构造以zi=ej2πdcos(θi)/λ,i=1,2,···,K为根的K次方程

    f(z)=Ki=1(zzi)=0 (13)

    将式(13)展开成

    f(z)=b0zK+b1zK1+···+bK=0 (14)

    不妨令b0=1,只需要确定多项式系数b=[b1,b2,···,bK]T,即可通过方程求根得到信号的仰角。构造M×(MK)维Toeplitz矩阵B

    B=[bKbK1···b00000bKbK1···b000000bKbK1···b0]H (15)

    对于i=1,2, ··· ,K,有

    BHa(θi)=f(zi)[1  zi  ···  zi(MK1)]T=0(MK)×1 (16)

    因此,BHAz=0(MK)×K,可知B是阵列流形Az的正交补。又因为 US=AzG1,所以有

    BHUS=0(MK)×N (17)

    US写成US=[u1,u2,···,uN],其中ui为第i个主奇异矢量,有

    BHui=Fibgi=0(MK)×1 (18)

    式中

    Fi=[[ui]K[ui]K1[ui]1[ui]K+1[ui]K[ui]2[ui]M1[ui]M2[ui]MK] (19)
    gi=[[ui]K+1,[ui]K+2,,[ui]M]T (20)

    [ui]K表示矢量ui的第K个元素。对式(17)进行矢量化

    vec(BHUS)=Fbg=0(MK)N×1 (21)

    式中F=[F1T,F2T,···,FNT]T, g=[g1T,g2T,···,gNT]T。在误差条件下,式(21)可以表示为

    ˆFbˆg (22)

    ˆFˆgFg的测量值。用加权最小二乘法(Weighted Least Squares, WLS)来求解b,即

    b=argminbˆeHWˆe (23)

    式中

    ˆe=ˆFbˆg=(INBH)ˆuS (24)
    W=(E{ˆeˆeH})1 (25)

    ˆuS=vec(ˆUS)为矢量化后的主特征矢量。容易得到式(23)的解为

    b=(ˆFHWˆF)1ˆFHWˆg (26)

    然而W又是b的函数,因此不能直接用式(26)求解b,需要对W作简化。文献[14]给出了W的近似解

    ˆW=D(BHB)1 (27)

    式中

    D=diag((λ1δ2)2λ1,(λ2δ2)2λ2,···,(λNδ2)2λN) (28)
    δ2=1MNMi=N+1λi (29)

    至此ˆb可以通过交替迭代求得。首先通过式(22)的最小二乘解ˆb0=ˆFˆg确定ˆb的初始值,再代入式(27)初始化ˆW,然后将ˆW代入式(23)更新ˆb,最后求解线性方程即可得到信号的仰角估计值{ˆθi}Ki=1

    同理,对方位角ϕ进行估计,构造以xi=ej2πdsin(θi)cos(ϕi)/λ,i=1,2,···,K为根的K次方程

    g(z)=c0xK+c1xK1+···+cK=0 (30)

    只需要确定多项式系数c=[c1,c2,···,cK]T,即可得到信号的方位角。构造M×(MK)维Toeplitz矩阵

    C=[cKcK1···c00000cKcK1···c000000cKcK1···c0]H (31)

    易知CHVS=0(MK)×K,因此只需要将式(22)中的US替换成VS,再进行相同的操作,即可确定系数ˆc,最后求解以ˆc为系数的方程得到K个根{xi}Ki=1。需要注意的是,不能通过xi直接估计方位角{ˆϕi}Ki=1,因为xi=ej2πdsin(θi)cos(ϕi)/λ,与ˆθi之间存在配对问题,需要通过配对算法得到正确的配对次序。

    通过仰角估计值{ˆθi}Ki=1可以得到ˆAz,通过K个根{xi}Ki=1可以得到ˆAx。然而在上述算法中,仰角和方位角是分别估计得到的,不存在关联,即ˆAzˆAx之间存在顺序模糊。易知自协方差矩阵与互协方差矩阵中都含有信号协方差RS,通过此共有信息可实现角度配对。将ˆAzˆAx分别表示为

    ˆAz=AzE1 (32)
    ˆAx=AxE2 (33)

    E1E2为列变换矩阵。易知,去噪后的自协方差矩阵ˉRZ,ˉRX以及互协方差矩阵R中都含有信号协方差矩阵RS,其中ˉRZ=ZZH/Lˆσ2IM, ˉRX=XXH/Lˆσ2IM。通过式(34)求出 RS

    RS1=ˆAz+ˉRZ(ˆAz+)H=E1TRSE1,RS2=ˆAx+ˉRX(ˆAx+)H=E2TRSE2RS3=ˆAx+RH(ˆAz+)H=E2TRSE1,RS4=ˆAz+R(ˆAx+)H=E1TRSE2} (34)

    最小化如式(35)代价函数p,可以得到E1, E2

    p=minE1,E2E2RS3E1TE1RS1E1T+E1RS4E2TE2RS2E2TF (35)

    不妨令H=E2TE1,其中H为列变换矩阵,在求解过程中需要加入本身的结构约束,即H的每行只有一个元素为1,其余元素为0。式(35)可进一步简化为

    p=minHRS3HRS1+HRS4HRS2HF (36)

    由式(32)和式(33)可知,ˆAzˆAxH是完全匹配的。因此只需最小化代价函数p,求出变换矩阵H即可完成角度配对。相比于文献[17]中的PSCM配对算法,本文所提的配对算法精度更高。

    步骤 1 首先求出降噪后的互协方差矩阵R

    步骤 2 将US按照式(19)和式(20)的形式构造矩阵Fg,得到b的初始值ˆb0=ˆF+ˆg,再通过式(27)和式(26)的交替迭代优化b,然后求解线性方程式(14)计算出K个根{zi}Ki=1,得到仰角的估计值ˆθi=arccos(λ2πdzi)

    步骤 3 将步骤2中的US替换为VS,重复步骤2的迭代操作,得到c,再求解式(30)计算出K个根{xi}Ki=1, xi中同时包含了仰角和方位角的信息;

    步骤 4 利用{zi}Ki=1{xi}Ki=1得到估计的阵列流形ˆAzˆAx,再通过最小化式(36)求出变换矩阵H,最后通过H得到配对后的角度{ˆθi}Ki=1, {ˆϕi}Ki=1

    L-PUMA算法的估计精度由线性方程ˆFbˆg决定,ˆF的维数越大,方程的个数越多,则b的计算精度越高。当信号完全相干时,主奇异矢量的个数减至1,大幅降低了线性方程的个数,算法性能下降严重,L-MPUMA通过构造反向主奇异矢量UR=JMUS来进一步扩大ˆF的维数,易知

    BH[US,UR]=BHAz[G,ϕ(M1)G]=0(MK)×2N (37)

    式中ϕ=diag([ej2πdcos(θ1)/λ,ej2πdcos(θ2)/λ,···,ej2πdcos(θK)/λ]),令USR=[US,UR]为增广主奇异矢量,可知BUSR正交,因此式(22)可扩展为

    ˆFSRbˆgSR (38)

    式中ˆFSR=[ˆFT,(JMKˆF)T]T, ˆgSR=[ˆgT,(JMKˆg)T]T。式(38)的解为

    b=argminbˆeSRHWSRˆeSR (39)

    式中ˆeSR=(I2NBH)ˆuSR, WSR=(E{ˆeSRˆeSRH})1ˆuSR=vec(ˆUSR)为矢量化后的增广主特征矢量, WSR2N个矩阵组成的块对角阵。由第3节的推导可知式(39)可进一步写为

    b=(ˆFSRHWSRˆFSR)1ˆFSRHWSRˆgSR (40)

    WSR中的第N+i个块矩阵为

    BHE{(JMˆui)(JMˆui)H}BBHJM(E{ˆuiˆuiH})JMBλiσ2L(λiσ2)2BHB (41)

    与第i个块矩阵完全相同。因此可以得到WSR的近似解

    ˆWSR=DSR(BHB)1 (42)

    式中

    DSR=blkdiag(D,D) (43)

    然后分别通过USVS构造增广主特征矢量USRVSR,最后通过迭代以及角度配对估计出仰角和方位角。

    为了方便描述,将文献[11]所提算法称为CCM算法,文献[12]所提的两种算法称为CVM和MCVM算法,文献[13]所提算法称为OMP算法。下面对L-PUMA算法和L-MPUMA算法的测向能力进行比较,在L-PUMA算法中,b由式ˆFbˆg确定,其中ˆF(MK)N×K矩阵,相当于通过(MK)N个方程确定K个未知数,当(MK)N<K时,b存在较大的求解误差,因此需要满足(MK)NK,即最大可分辨信号数kmax=NN+1M。同理,对于L-MPUMA算法,b由式ˆFSRbˆgSR确定,其中ˆFSR2(MK)N×K维矩阵,因此最大可分辨信号数kmax=2N2N+1M,相比于L-PUMA, L-MPUMA算法提高了最大可分辨信号数,并且本文提出的两种算法较以往算法都提高了信号分辨数。

    将本文提出的L-PUMA, L-MPUMA算法与CCM, CVM, MCVM以及OMP算法进行比较。假设接收阵元噪声为高斯白噪声,噪声间相互独立,每次仿真均进行1000次蒙特卡罗实验。

    实验1:配对算法性能比较

    为了验证本文所提配对算法的有效性,将L-PUMA算法中的配对环节用文献[17]中的PSCM配对算法替代,简称为L-PUMA2算法。同样地,将L-MPUMA算法中的配对环节用PSCM替代,称为L-MPUMA2算法。假设有3个信号入射到17个阵元构成的L型阵列上,入射信号的仰角、方位角分别为(65,120), (80,105)(95,90)。前两个信号相干,相干系数为[1,0.4ejπ/3],第3个信号独立,快拍数为200。由图2可知,当5dB<SNR<5dB时,L-PUMA算法的RMSE明显低于L-PUMA2, L-MPUMA算法的RMSE明显低于L-MPUMA2,可见改进的配对算法提升了算法性能。

    图 2  配对算法RMSE随SNR的变化

    再分析临近目标对配对算法性能的影响,假设SNR=10dB,快拍数为200,阵元数保持不变。有两个相干信号入射到接收阵列上,第1个信号的仰角、方位角为(50,80),第2个信号的仰角、方位角为(50+Δα,80Δα), Δα表示角度间隔,其变化范围为110,步长为0.5。如图3所示,随着角度间隔的增加,入射信号的空间分辨率越来越大,配对成功率随之升高,其中经过配对算法改进的L-PUMA的成功率要高于L-PUMA2,同理,L-MPUMA的成功率也高于L-MPUMA2。

    图 3  配对成功率随角度间隔的变化

    实验2:信噪比变化对算法性能的影响

    假设有3个信号入射到17个阵元构成的L型阵列上,入射信号的仰角、方位角分别为(65,120), (80,105)(95,90)。前两个信号相干,相干系数为[1,0.4ejπ/3],第3个信号独立,快拍数为200。由图4可知,当SNR<5dB时,CCM算法的RMSE最低,当SNR>5dB时,L-MPUMA算法的RMSE最低,L-PUMA算法次之,而CVM和MCVM的RMSE均较大,OMP算法的性能在所有算法中处于中间水平。

    图 4  RMSE随SNR的变化(部分相干)

    仅改变入射信号之间的相干性,假设信号完全相干,相干系数为[1,0.3ejπ/10,0.8ejπ/6]。由图5可知,OMP算法在低信噪比条件下性能下降严重,L-PUMA算法的RMSE整体升高,性能完全被CCM算法超越,这是由于信号的完全相干导致了线性方程个数的减少,因此估计精度下降。而L-MPUMA算法仍能保持很好的性能,当SNR>5dB时,其RMSE低于任何一种算法。

    图 5  RMSE随SNR的变化(完全相干)

    实验3:快拍数变化对算法性能的影响

    SNR=10dB,快拍数从100增加至1000,其余参数均与实验2相同。如图6所示,当信号部分相干时,可以看出算法受快拍数的影响不大,RMSE变化较为平缓,各算法的性能由差到好排序依次是:CVM, MCVM和CCM, L-PUMA, OMP, L-MPUMA。

    图 6  RMSE随快拍数的变化(部分相干)

    仅改变信号相干性,将部分相干的信号改成完全相干。如图7所示,当信号完全相干时,所有算法的RMSE均被抬高,其中L-PUMA的RMSE与CVM和MCVM相当,性能下滑严重;CCM和OMP算法的性能处于中间水平;而L-MPUMA的RMSE则最低,性能最好。可见信号的相干越大,解相干算法的性能越差,L-PUMA对于信号的相干程度十分敏感,而L-MPUMA受到的影响则较小,鲁棒性较好。

    图 7  RMSE随快拍数的变化(完全相干)

    实验4:多目标处理能力

    假设SNR=10dB,快拍数为200,共有4个相干信号入射到11个阵元组成的L型阵列上,仰角、方位角分别为(65,115), (80,100), (95,85)(110,70)。假设4个信号完全相干,都属于同一组相干信号,即N=1,如图8所示,星号代表目标的真实位置,可以看出L-MPUMA算法估计出的角度与真实角度比较接近,而L-PUMA算法则出现估计错误,估计值严重偏离真实值。这是因为在N=1, M=6的条件下,L-PUMA最多可处理的信号数为kmax=NN+1M=3, L-MPUMA可处理的信号数为kmax=2N2N+1M=4

    图 8  目标的空间分布(1组相干信号)

    假设4个信号部分相干,分为两组相干信号,即N=2,且每组信号数为2个,仰角和方位角保持不变。从理论上分析,L-PUMA最多可处理的信号数为4个,L-MPUMA可处理的信号数为4.8个,向下取整为4个。如图9所示,两种算法估计出的目标均接近真实目标,其中L-MPUMA的偏差更小,L-PUMA的偏差稍大但也能做到准确估计。与图8中信号完全相干的情况相比,此时算法的分辨率有很大提升。

    图 9  目标的空间分布(2组相干信号)

    在其他条件不变的情况下,再增加一个独立信号,新增的仰角、方位角为(125,55),此时共有3组相干信号,即N=3,信号总数为5个,阵元数仍保持11个。由分析可知L-PUMA最多可处理4个信号,L-MPUMA最多可处理5个信号。如图10所示,L-MPUMA算法仍可以得到和真实目标较为接近的结果,而L-PUMA算法则完全失效,无法显示出目标。

    图 10  目标的空间分布(3组相干信号)

    本文针对L型阵列相干信号DOA估计问题,提出了两种解相干算法:L-PUMA和L-MPUMA算法,较大程度提高了估计精度和最大可分辨信号数。虽然L-PUMA算法在信号完全相干条件下性能下降比较严重,但当信号部分相干时性能良好。L-MPUMA算法则对信号的相干程度不敏感,进一步提高了精度和鲁棒性。

  • 图  1  LU分解过程矩阵特性分布

    图  2  BDPLU算法原理图

    图  3  飞机I仿真模型和双站RCS结果

    图  4  飞机II双站RCS结果

    图  5  加速比和并行效率

    表  1  CALU算法与BDPLU算法矩阵求解时间对比

    FT2000+核数矩阵求解时间(s) 并行效率(%)
    CALUBDPLUCALUBDPLU
    2000796.54742.57100100
    3000567.78518.6893.5395.44
    4000463.93421.1285.8588.17
    5000386.89338.2482.3587.82
    10000226.57187.8370.3179.07
    15000172.91139.0561.4271.20
    20000133.97118.3859.4662.73
    4000072.8364.6154.6857.47
    下载: 导出CSV

    表  2  BDPLU算法求解矩阵的加速比和并行效率

    FT2000+核数矩阵求解时间(s)加速比并行效率(%)
    960029183.331100
    480006336.534.6192.11
    960003501.738.3383.34
    1920002035.3514.3471.69
    2400001764.5316.5466.16
    3360001328.1321.9762.78
    3840001227.9123.7759.42
    4320001133.6425.7457.21
    4800001043.4527.9755.94
    504000997.9429.2455.70
    552000937.8231.1254.12
    600000898.8132.4951.95
    下载: 导出CSV
  • HARRINGTION R F. Field Computation by Moment Methods[M]. New York; IEEE Press, 1993.
    王长清. 现代计算电磁学基础[M]. 北京: 北京大学出版社, 2005: 116–157.

    WANG Changqing. Computational Advanced Electromagnetics[M]. Beijing: PeKing University Press, 2005: 116–157.
    ZHANG Yu and SARKAR T K. Parallel Solution of Integral Equation Based EM Problems in the Frequency Domain [M].Hoboken, USA: Wiley-IEEE, 2009: 107–136.
    张玉, 赵勋旺, 陈岩, 等. 计算电磁学中的大规模并行矩量法[M]. 西安: 西安电子科技大学出版社, 2016: 11210.

    ZHANG Yu, ZHAO Xunwang, CHEN Yan, et al. Massively Parallel Method of Moment in Computational Electromagnetics[M].Xi’an: Xidian University Press, 2016: 11210.
    林中朝, 张爽, 王星, 等. 高阶矩量法在国产超级计算机上的并行性能[J]. 微波学报, 2014, 30(S1): 44–47

    LIN Zhongchao, ZHANG Shuang, WANG Xing, et al. Parallel performance of higher-order MoM on a domestically-made supercomputer[J]. Journal of Microwaves, 2014, 30(S1): 44–47
    林中朝, 陈岩, 张玉, 等. 国产CPU平台中并行高阶矩量法研究[J]. 西安电子科技大学学报, 2015, 42(3): 43–47 doi: 10.3969/j.issn.1001-2400.2015.03.008

    LIN Zhongchao, CHEN Yan, ZHANG Yu, et al. Study of the parallel higher-order MoM on a domestically-made CPU platform[J]. Journal of Xidian University, 2015, 42(3): 43–47 doi: 10.3969/j.issn.1001-2400.2015.03.008
    ZHANG Yu, LIN Zhongchao, ZHAO Xunwang, et al. Performance of a massively parallel higher-order method of moment code using thousands of CPUs and its applications[J]. IEEE Transactions on Antenna Propagation, 2014, 62(12): 6317–6324 doi: 10.1109/TAP.2014.2361135
    ZHAO Xunwang, CHEN Yan, ZHANG Huanhuan, et al. A New Decomposition Solver for Complex Electromagnetic Problems[J]. IEEE Antennas & Propagation Magazine, 2017, 59(3): 131–140 doi: 10.1109/MAP.2017.2687119
    CHEN Yan, ZHANG Yu, ZHANG Guanghui, et al. Hybrid MIC/CPU parallel implementation of MoM on MIC cluster for electromagnetic problems[J]. IEICE Transactions on Electronics, 2016, 99(7): 735–743 doi: 10.1587/transele.E99.C.735
    CHEN Yan, ZHANG Guanghui, LIN Zhongchao, et al. Solution of EM problems using hybrid parallel MIC/CPU implementation of higher-order MoM[C]. IEEE International Symposium on Microwave, Antenna, Propagation, and Emc Technologies. Shanghai, China, 2016: 789–791.
    左胜, 陈岩, 张玉, 等. 一种可扩展异构并行核外高阶矩量法[J]. 西安电子科技大学学报, 2017, 44(1): 146–151 doi: 10.3969/j.issn.1001-2400.2017.01.026

    ZUO Sheng, CHEN Yan, ZHANG Yu, et al. Study of the scalable heterogeneous parallel out-of-core higher order method of moments[J]. Journal of Xidian University, 2017, 44(1): 146–151 doi: 10.3969/j.issn.1001-2400.2017.01.026
    CHEN Yan, ZUO Sheng, ZHANG Yu, et al. Large-scale parallel method of moments on CPU/MIC heterogeneous clusters[J]. IEEE Transactions on Antennas & Propagation, 2017, 65(7): 3782–3787 doi: 10.1109/TAP.2017.2700871
    TANG Min, ZHAO Jieyi, TONG Ruofeng, et al. GPU accelerated convex hull computation[J]. Computers & Graphics, 2012, 36(5): 498–506 doi: 10.1016/j.cag.2012.03.015
    陈岩. 高性能矩量法及其在复杂目标电磁模拟中的应用[D]. [博士论文], 西安电子科技大学, 2017: 86–91.

    Chen Yan. High performance method of moments and its application in electromagnetic simulation of complex targets[D]. [Ph.D. dissertation], Xidian University, 2017: 86–91.
    ZHANG Yu, CHEN Yan, ZHANG Guanghui, et al. A highly efficient communication avoiding LU algorithm for Methods of Moments[C]. IEEE International Symposium on Antennas and Propagation & Usnc/ursi National Radio Science Meeting, Vancouver, Canada, 2015: 1672–1673.
    Intel® Developer Zone: Intel® Math Kernel Library [OL]. https://software.intel.com/en-us/forums/intel-math-kernel-library/, 2018.
    徐晓飞, 曹祥玉, 高军, 等. 基于矩量法的电大目标RCS核外并行计算[J]. 电子与信息学报, 2011, 33(3): 758–762 doi: 10.3724/SP.J.1146.2010.00519

    XU Xiaofei, CAO Xiangyu, GAO Jun, et al. Parallel out-of-core calculation of electrically large objects’ RCS based on MoM[J]. Journal of Electronics &Information Technology, 2011, 33(3): 758–762 doi: 10.3724/SP.J.1146.2010.00519
    马骥, 龚书喜, 王兴, 等. 一种快速计算目标宽带雷达截面的电磁算法[J]. 西安电子科技大学学报, 2012, 39(4): 98–102 doi: 10.3969/j.issn.1001-2400.2012.04.018

    MA Ji, GONG Shuxi, WANG Xing, et al. Fast computation of the wide-band radar cross section of arbitrary objects[J]. Journal of Xidian University, 2012, 39(4): 98–102 doi: 10.3969/j.issn.1001-2400.2012.04.018
    国家超级计算广州中心: 产品中心[OL]. http://www.nscc-gz.cn/Product/HighPerformanceComputingService/ServiceCharacteristics.html, 2018.6.
  • 期刊类型引用(2)

    1. 李齐衡,孙溶辰,孙志国. 基于矩阵重构和酉变换的DOA估计. 应用科技. 2024(01): 120-129 . 百度学术
    2. 王绪虎,冯洪浩,孙高利,贺劲松. L型互质阵的虚拟共轭插值二维DOA估计方法. 信号处理. 2024(10): 1834-1845 . 百度学术

    其他类型引用(6)

  • 加载中
图(5) / 表(2)
计量
  • 文章访问数:  2047
  • HTML全文浏览量:  819
  • PDF下载量:  67
  • 被引次数: 8
出版历程
  • 收稿日期:  2018-06-04
  • 修回日期:  2018-12-13
  • 网络出版日期:  2018-12-19
  • 刊出日期:  2019-04-01

目录

/

返回文章
返回