Loading [MathJax]/jax/element/mml/optable/MathOperators.js
高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

用多频带能量分布检测低信噪比声音事件

李应 吴灵菲

何山红, 纪萌茜, 解良玉, 范瑾, 范冲. 一种快速稳健的致密焦面阵列馈源设计方法[J]. 电子与信息学报, 2019, 41(11): 2623-2631. doi: 10.11999/JEIT190026
引用本文: 李应, 吴灵菲. 用多频带能量分布检测低信噪比声音事件[J]. 电子与信息学报, 2018, 40(12): 2905-2912. doi: 10.11999/JEIT180180
Shanhong HE, Mengqian JI, Liangyu XIE, Jin FAN, Chong FAN. A Fast and Robust Design Method for Dense Focal Plane Array Feed[J]. Journal of Electronics & Information Technology, 2019, 41(11): 2623-2631. doi: 10.11999/JEIT190026
Citation: Ying LI, Lingfei WU. Detection of Sound Event under Low SNR Using Multi-band Power Distribution[J]. Journal of Electronics & Information Technology, 2018, 40(12): 2905-2912. doi: 10.11999/JEIT180180

用多频带能量分布检测低信噪比声音事件

doi: 10.11999/JEIT180180
基金项目: 国家自然科学基金(61075022),福建省自然科学基金(2018J01793)
详细信息
    作者简介:

    李应:男,1964年生,教授,研究方向为信息安全、多媒体数据检索

    吴灵菲:女,1994年生,硕士生,研究方向为信息安全、模式识别

    通讯作者:

    李应  fj_liying@fzu.edu.cn

  • 中图分类号: TP391.42

Detection of Sound Event under Low SNR Using Multi-band Power Distribution

Funds: The National Natural Science Foundation of China (61075022), The Natural Science Foundation of Fujian Province (2018J01793)
  • 摘要: 该文针对低信噪比噪声环境下的声音事件检测问题,提出基于多频带能量分布图离散余弦变换的声音事件检测的方法。首先,将声音数据转化为gammatone频谱,并计算其多频带能量分布;接着,对多频带能量分布图进行8×8分块与离散余弦变换;然后,对8×8的离散余弦变换系数进行Zigzag扫描,抽取离散余弦变换系数的主要系数作为声音事件的特征;最后,利用随机森林分类器对特征建模与检测。实验结果表明,在低信噪比及各种噪声环境下,该文提出的方法具有良好的检测效果。
  • 扩大反射面天线的视场,可以提高射电天文望远镜、雷达天线、电子侦察天线和卫星通信天线等的观察效率。多波束馈源是拓宽视场的一种典型方法。

    多喇叭多波束馈源[16]由于受到喇叭几何尺寸的限制,相邻喇叭之间的间距无法保证对应的反射面天线的相邻波束相交于半功率点,相邻波束之间的盲区只能依靠下一时刻移动反射面来覆盖,这样会导致视场不连续。另外,由于单个喇叭无法自由控制其辐射方向图,倾斜波束的增益会随着倾斜角的增大而迅速降低,旁瓣电平也会升高。为了保证每个波束的性能不至于相差过大,波束数目会受到限制,在很多领域限制了它的应用。

    数字波束相控阵列馈源不但可以同时产生多个波束,更主要的是它还可以实现快速扫描和波束赋形[79]。但在一些场合,波束需要长久地停留在观察区域工作,如射电天文望远镜需要长时间观察天体辐射的非平稳随机信号,且接收机也需要对天体发射的微弱信号进行长时间的积分提高灵敏度。在卫星通信中,信号覆盖区域往往是固定的。因此相控阵列馈源的快速扫描功能有时候不一定能发挥其优势。另外,如500 m口径球面望远镜(Five-hundred-meter Aperture Spherical Telescope, FAST)未来需要同时产生逾百个波束在观测区域内实现连续观测,过多的波束数目加大了相控阵列馈源的实现难度。

    致密焦面阵列馈源(Dense Focal Plane Array Feed, DFPAF)[1012]融合了多喇叭多波束馈源和相控阵列馈源(Phased Array Feed, PAF)的特点,它可以同时提供更多的固定赋形波束,因此其阵列结构和设计方法等与常规阵列馈源不同。对于给定的阵列馈源结构,求解每个阵元的激励电压,使阵列馈源产生期望的初级辐射方向图来实现反射面性能是阵列馈源设计的主要内容。已有求解激励电压的方法可以归纳为两类,其中一类方法是采用智能优化算法,如以反射面最大信噪比和最小零点电平为优化目标函数的粒子群优化算法[13],以反射面最大增益为优化目标函数的相位梯度搜索算法[14]等。另一类方法是在期望的反射面远场辐射方向图上采样多个点[15,16],再利用最小二乘法[15]或者线性约束最小方差法[16]等方法,通过求解联立方程计算出激励电压的值。

    反射面天线的灵敏度是致密焦面阵列馈源设计中需要考虑的主要因素,灵敏度主要由反射面天线的效率和系统噪声决定。反射面的口面电场决定了反射面天线的效率。系统噪声除了接收机固有的噪声之外,还有反射面接收到的空间噪声。在现代高性能反射面天线设计中,除了反射面的第1旁瓣电平需要满足特定的要求之外,在远角区域,旁瓣电平也需要服从特定的包络分布来降低空间噪声或者防止通信干扰。当波束数目很多时,整个阵列馈源的阵元数目也会很多,很多阵元还要被多个波束共用,需要设计的参数很多,增大了智能优化算法[9,13,14]的求解难度。对辐射方向图进行采样时[15,16],由于大型反射面的远场辐射方向图变化剧烈,且为了满足远角旁瓣电平包络,需要在很宽的角度范围内采样足够多的点才能精确描述其特征;另外由于倾斜波束的辐射方向图是不对称的,需要在多个平面上进行采样。此时采样点过多,增加了求解过程的复杂度。上述因素都会降低处理过程的效率,削弱求解过程的稳健性,甚至无法求解出正确的结果。

    因此本文充分利用反射面天线的固有特性,并结合阵列天线设计方法,提出了一种新的致密焦面阵列馈源设计方法。

    对于给定的阵列馈源结构,快速、稳健地确定每个波束的阵元数目和求解每个阵元的激励电压是主要设计内容。设计过程共分成4步:(1)对给定方向的入射波,按照高效率、低旁瓣等要求,设计出其在反射面口面上的电场分布[1719]后,再计算出入射波在反射面焦平面上的电场;(2)利用焦面电场,确定每个波束对应的阵列馈源的阵元,并利用洛伦兹互易定理[20]确定每个阵元的初始激励电压;(3)以焦面电场的初级辐射方向图与阵列馈源的初级辐射方向图的匹配度最高为优化目标,对阵元的初始激励电压进行修正得到更精确的激励电压;(4)利用辅助波束法对反射面远场辐射方向图的局部区域进行修正。下面给出详细的设计过程。

    在双反射面或三反射面天线设计中,合理的口面电场[1719]常被用来同时实现高增益、低旁瓣电平和低噪声等性能。由于抛物面天线只有一个反射面,且经常是单个喇叭馈电,口面电场很少应用在抛物面天线设计中,但阵列馈源使其在抛物面天线设计中的应用成为了可能。通过优化口面电场可以将多个优化目标函数合成一个或少量目标函数。对于对称口面电场,可以选择一些经典的口面电场[17,18],或者通过对一些固定函数的参数进行控制[19]设计出期望的口面电场。由于馈源偏焦距离产生的相位差[4]主要用来决定波束指向,因此本设计中只考虑电场幅度分布。对于非对称的倾斜波束,尤其倾斜角度较大时,反射面每个平面的辐射方向图会存在一定的差异,为了让所有平面的性能尽可能一致,此时采用可分离口面电场,即先将圆形口面视做一个与圆外切的方形平面,在方形平面上,按照线阵激励电压的设计方法,分别设计出波束倾斜方向和与之正交方向的沿线激励电压分布,再将其它点的激励电压表达为上述2个正交沿线激励电压的乘积。一般情况下沿线激励电压分布为锥削分布,在方形平面4个顶点的附近区域,激励电压的值比较低,可以将4个顶点附近区域切除,还原成原来的圆形口面。

    为了求解阵元的激励电压,下面先求解焦面电场。为了便于和目前最具代表性的FAST多喇叭多波束馈源[4,9]进行比较,反射面采用直径为300 m、边缘照射角度为57°的FAST抛物面。其坐标系如图1所示。根据收发互易原理,从(Θ,φ)方向入射的平面波,设其在反射面口面上P点的电场为ρ(x),此处设ρ(x)关于反射面轴线对称。P点对应的反射面上的点为P。对于电大尺寸反射面而言,焦平面上阵元的偏焦距离与焦距的比值很小,可以近似认为PP平行于反射面轴线,根据能量守恒定理,P点在单位面积内的能量与投射到反射面口面单位面积内的能量相等,因此得到P点的电场ρ

    图 1  抛物面天线坐标系
    ρ=ρ{[sin(2θ)+2sin3θ/(1+cosθ)]/4sin(θ/2)}1/2(1)

    利用反射面上每点的感应电流Je,计算出焦平面上任意点P处的电场E

    E=jωμ04πrejkr (2)

    此处{\mu _0}为真空磁导率,\hat r'{\text{PP}}''对应的单位矢量,r'为矢量{\text{PP}}''的长度,r为点P\;到焦点的距离,k为传播常数,\omega 为角频率。

    根据波束指向与馈源偏焦距离的相对关系式[4]

    \frac{{{\theta _{\rm{b}}}}}{{{\theta _{\rm{a}}}}} = {\sin ^{ - 1}}\left[ {\frac{d}{f} \cdot \frac{{1 + t(D/4f)}}{{1 + {{(D/4f)}^2}}}} \right] \cdot \frac{1}{{{{\tan }^{ - 1}}\left( {d/f} \right)}} (3)

    可以求出每个波束在焦平面上的等效相位中心,即对应的喇叭中心。式(3)中,D为反射面直径,{\theta _{\rm{b}}}{\theta _{\rm{a}}}分别为波束倾斜角和喇叭倾斜角,d为喇叭横向偏焦距离,f为反射面焦距,t为与fd相关的系数,取值范围为0.3\sim 0.7。利用式(3)并结合反射面半功率波束宽度{\theta _{0.5}}的关系式

    {\theta _{0.5}} = (70\lambda /D)^\circ (4)

    可以确定阵元间距与阵元位置。式(4)中\lambda 为自由空间波长。图2(a)给出了作为比较的19阵元6边形多喇叭多波束馈源结构[4]和每个喇叭的坐标。图2(b)给出了利用式(3)和式(4)设计的127阵元6边形致密焦面阵列馈源结构。

    图 2  馈源结构

    两种阵列选用的阵元形式和阵元几何尺寸是不相同的,因此阵元间距也不相同。图2(a)的阵元间距是图2(b)的2倍。图2(a)对应的抛物面的相邻波束间隔在中心频率(1.25 GHz)是2个半功率波束宽度。图2(b)的相邻波束间隔近似为图2(a)的1/2,相邻波束相交于半功率点。

    下面的设计例子选取一个从\varTheta =–0.045°和\varphi =90°方向垂直入射(沿x轴线)的平面波。口面电场选取轴对称改进型幂指数分布,该口面电场已经在实践中经过验证,对于中心波束,其可以实现接近80%的口面效率和低于–20 dB的第1旁瓣电平,且旁瓣电平依次递减。图3给出了利用式(2)得到的焦面电场等高线。图中焦平面的大小为1800×1800 mm,可以捕获入射波的绝大部分能量。可以看出,图2(b)中的5号阵元中心(x = 0, y = 130)接近焦面电场的中心。根据式(3),如果在图2(a)中1号阵元和2号阵元的中心位置(x = 0, y = 130),即对应图2(b)中的5号阵元中心放置1个阵元,利用物理光学方法可以计算出抛物面的波束指向为\varTheta =–0.045°, \varphi =90°,与预置的波束指向一致。

    图 3  中心频率的焦面电场分布

    将焦面电场的辐射场作为反射面的初级馈源辐射场,计算得到的反射面辐射远场将与口面电场决定的反射面辐射远场一致。阵列馈源是对焦面电场的采样,采样点越多,采样间隔越小,利用采样点计算得到的辐射场越接近焦面电场的辐射场。但对于FAST等系统而言,需要同时形成逾百个波束,如果每个波束都利用图2(b)所示的所有阵元,会加重后端数字信号处理部分的难度,是不现实的。同时从图3发现,焦面电场主要分布在局部区域,离该区域的中心越远,电场衰减越厉害。因此可以按照一定的原则选取部分阵元组成每个波束的阵列馈源。为了计算方便,整个焦平面被划分成等间隔的37×37个网格点,选取与电场最强的网格点最近的阵元的中心作为等效相位中心,与等效相位中心的电场之差不小于–25 dB的阵元均被选作该阵列馈源的阵元,这样共有19个阵元。阵元采用宽波束阵元形式,它在其口面上的辐射电场认为是均匀的。运用洛伦兹互易定理[20]求阵元的等效口面电场时,为简单起见,如图2(b)所示,选取与每个阵元所在的圆周相切的6边形的6个顶点和圆心处的焦面电场的平均值作为该阵元的等效口面电场,亦即该阵元的初始激励电压。此时由于受阵元数目与阵元间距的限制,不可避免地会存在截断误差。

    本设计例子选取5个典型波束进行研究,首先根据式(3)求出与图2(b)所示的5个阵元中心位置对应的波束指向,波束序号用与其对应的阵元序号命名,即:1号波束(\varTheta =0°, \varphi =90°), 5号波束(\varTheta =–0.045°, \varphi =90°), 14号波束(\varTheta =–0.0925°, \varphi =90°), 29号波束(\varTheta =–0.14°, \varphi =90°)和50号波束(\varTheta =–0.185°, \varphi =90°)。其中,5号波束即为2.1节的设计例子。按照上述方法得到各个波束的阵元为:1号波束:1, 3, 4, 6, 7, 5, 2, 8, 14, 9, 13, 15, 19, 10, 12, 18, 16; 5号波束:5, 4, 6, 1, 13, 15, 14, 29, 28, 30, 27, 31, 2, 11, 17, 3, 7, 12, 16; 14号波束:14, 13, 15, 5, 28, 30, 29, 50, 49, 51, 48, 52, 77, 12, 16, 1; 29号波束:29, 14, 28, 30, 49, 51, 50, 77, 78, 76, 79, 75, 110, 31, 48, 52, 27; 50号波束:50, 29, 49, 51, 76, 78, 77, 109, 110, 111, 108, 112, 75, 79。

    对上述37×37个网格点的电场进行离散积分,计算得到的5号波束的焦面电场初级辐射方向图画在图4(a)图4(b)中,并标注为“焦面场”。图4(a)图4(b)同时给出了利用初始激励电压计算得到的5号波束的阵列馈源初级辐射方向图,并标注为“初始系数”。可以看出,在反射面的中心区域和边缘(±57°)处,两者的幅度辐射方向图相差较大,导致反射面的性能也会有一定的差异。但两者的相位辐射方向图吻合度较高,说明截断误差对相位辐射方向图的影响小,因此有必要对初始激励电压的幅度进行修正。

    图 4  中心频率的初级辐射方向图(\varphi = 90°平面)

    相对于反射面天线的远场辐射方向图,馈源初级辐射方向图随角度变化平缓,可以用更少的参数描述其特征;且初级辐射方向图的微小变化,对反射面远场辐射方向图的影响可以忽略。因此用馈源初级辐射方向图代替反射面远场辐射方向图[15,16]可以简化修正目标函数,提高设计过程的稳健性。因为每个平面的初级幅度辐射方向图相差不大,因此只需要选取3个主要平面,即\varphi =90°, \varphi =0°和\varphi =45°的幅度辐射方向图作为衡量参数,即可以保证修正过程的有效性。由能量守恒定律,馈源辐射的能量等于反射面口面上的能量。因此下面以阵列馈源与焦面电场两者的辐射能量差\Delta P最小作为修正目标函数。

    由于在反射面边缘,初级辐射方向图的电平较低;同时在反射面的中心区域,其面积元小,捕获的能量少。运用能量守恒定律修正激励电压时,在这些区域得到的结果经常是不可靠的,甚至会出现奇异结果。因此需要在这些区域增加一些约束条件。第1个约束条件是在中心区域附近,在3个平面上选取几个等间隔点,将这些点的电平约束在一定的范围内。例子中选取了–20°, –10°, 0°, 10°和20°共5个点,参考初级辐射方向图将其归一化电平约束在0~–4 dB范围内。反射面边缘(±57°)照射电平为另一个约束条件,在反射面口面效率和泄露效率之间进行折中考虑,并参考初级辐射方向图,将其取值范围约束在–8~–16 dB范围内。设焦面电场初级辐射方向图为{f_1}(\theta , \varphi ),阵列馈源初级辐射方向图为{f_2}(\theta , \varphi ),则目标函数为

    \left. \begin{gathered} {\rm{Min}} \, (\Delta P) = {\rm{Min} }\, \bigg(\iint {\left| {\, {{[{f_1}(\theta , \varphi )]}^2} - {{[{f_2}(\theta , \varphi )]}^2}\, } \right|}\sin \theta \, {\rm{d}}\theta \, {\rm{d}}\varphi \bigg) \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; |{f_2}[( - 20^\circ \, , \, - 10^\circ \;, \;0^\circ \;, \;10^\circ \;, \;20^\circ )\, , (\, 0^\circ \;, \;45^\circ , \;90^\circ \, )]{\, ^2}|\; \in ( - 4\sim\, 0\;{\rm{dB}})\quad \quad \\ \!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\! |{f_2}[( - 57^\circ \, , \, 57^\circ )\, , (\, 0^\circ , \;45^\circ , \;90^\circ \, )]{\, ^2}|\; \in ( - 8\, \sim\, - 16\;{\rm{dB}})\; \\ \end{gathered} \right\} (5)

    由于每个阵列馈源的阵元数目仅20个左右,阵元中具有相同或接近的初始激励电压的阵元可以采用相同的修正系数。同时,初始激励电压幅度相对较低的阵元发挥的作用不大,可以不用修正。这样一来,修正系数并不多。因此参考初始激励电压,设定修正值范围后采用简单的循环查找方法即可完成修正过程。对2.2节的例子进行修正后的阵列馈源初级辐射方向图画在图4(a)图4(b)中,并标注为“初始加权”。可以看出,修正后的阵列馈源初级幅度辐射方向图与焦面电场初级幅度辐射方向图的吻合度得到了很大提高。上述修正过程没有考虑阵元之间的互耦影响,考虑互耦时,测量或者计算得到每个阵元的有源导纳后,可以对修正后的激励电压进行幅度和相位补偿而获得精确的结果。

    图5(a)给出了利用修正后的激励电压,采用物理光学方法计算得到的5个波束的抛物面远场辐射方向图。为了进行对比分析,在图2(b)所示的1号、5号、14号、29号和50号阵元的中心分别放置1个文献[4]中的馈源喇叭,并采用多喇叭多波束馈源理论[4]计算得到的抛物面远场辐射方向图如图5(b)所示。

    图 5  抛物面天线在中心频率的远场辐射方向图(\varphi =90°)

    表1在工作频带(1.05~1.45 GHz)内,将两种天线的性能进行了对比,包括增益、天线效率、第1旁瓣电平、半功率波束宽度、每个波束与中心波束的增益差。计算天线效率时考虑了天线的口面效率、馈源初级辐射方向图的泄露效率、并扣除了馈线损耗0.2 dB。表1中同时给出了利用焦面电场初级辐射方向图计算得到的反射面性能。

    表 1  多波束反射面天线性能总结表
    波束馈源类型天线增益(dB)天线效率(%)第1旁瓣电平(dB)半功率波束宽度(°)波束指向(°)与中心波束的增益差(dB)
    1号1.05 GHz焦面场75.0874.00–17.100.05960.0000.00
    多喇叭多波束馈源74.4664.15–24.100.06120.0000.00
    致密焦面阵列馈源74.9872.32–17.600.06060.0000.00
    5号1.05 GHz焦面场75.0172.82–16.400.0600–0.045–0.07
    多喇叭多波束馈源74.3862.97–19.900.0616–0.045–0.08
    致密焦面阵列馈源74.9471.66–16.100.0616–0.045–0.04
    14号1.05 GHz焦面场74.9271.32–16.500.0599–0.090–0.16
    多喇叭多波束馈源74.2060.47–17.600.0619–0.090–0.26
    致密焦面阵列馈源74.7468.43–20.200.0622–0.090–0.24
    29号1.05 GHz焦面场74.8169.54–16.400.0598–0.140–0.27
    多喇叭多波束馈源74.0057.70–15.400.0622–0.140–0.46
    致密焦面阵列馈源74.6166.41–17.100.0619–0.140–0.37
    50号1.05 GHz焦面场74.5865.95–15.600.0617–0.180–0.50
    多喇叭多波束馈源73.7854.91–13.500.0626–0.185–0.68
    致密焦面阵列馈源74.4263.57–15.300.0626–0.180–0.56
    1号1.25 GHz焦面场76.6775.46–16.900.05000.0000.00
    多喇叭多波束馈源76.1867.29–26.800.05270.0000.00
    致密焦面阵列馈源76.6274.42–19.100.05140.0000.00
    5号1.25 GHz焦面场76.5773.66–17.100.0500–0.045–0.10
    多喇叭多波束馈源76.0565.34–21.500.0530–0.045–0.12
    致密焦面阵列馈源76.5573.36–18.400.0519–0.045–0.06
    14号1.25 GHz焦面场76.4671.80–16.200.0502–0.090–0.21
    多喇叭多波束馈源75.8462.31–17.200.0542–0.090–0.33
    致密焦面阵列馈源76.2568.37–18.600.0529–0.090–0.36
    29号1.25 GHz焦面场76.3369.67–16.100.0505–0.140–0.34
    多喇叭多波束馈源75.6058.97–15.000.0538–0.140–0.57
    致密焦面阵列馈源76.2067.66–19.200.0526–0.135–0.41
    50号1.25 GHz焦面场76.1366.50–15.700.0512–0.180–0.54
    多喇叭多波束馈源75.2954.86–13.000.0548–0.185–0.88
    致密焦面阵列馈源75.9764.17–15.800.0535–0.185–0.64
    1号1.45 GHz焦面场78.0677.07–16.700.04260.0000.00
    多喇叭多波束馈源77.5268.06–30.600.04680.0000.00
    致密焦面阵列馈源78.0176.19–19.900.04400.0000.00
    5号1.45 GHz焦面场77.9775.49–16.600.0426–0.045–0.09
    多喇叭多波束馈源77.3966.05–21.600.0470–0.045–0.13
    致密焦面阵列馈源77.9074.28–18.800.0437–0.045–0.11
    14号1.45 GHz焦面场77.8573.43–16.200.0427–0.095–0.21
    多喇叭多波束馈源77.1662.64–17.200.0480–0.095–0.35
    致密焦面阵列馈源77.6469.96–20.100.0456–0.095–0.37
    29号1.45 GHz焦面场77.6770.45–16.500.0488–0.140–0.39
    多喇叭多波束馈源76.8658.46–15.000.0486–0.140–0.65
    致密焦面阵列馈源77.4967.59–17.500.0445–0.140–0.52
    50号1.45 GHz焦面场77.4366.66–16.000.0439–0.185–0.63
    多喇叭多波束馈源76.4453.07–12.800.0499–0.185–1.07
    致密焦面阵列馈源77.2263.52–13.700.0465–0.180–0.79
    下载: 导出CSV 
    | 显示表格

    可以看出,对于中心波束,第1旁瓣电平与设计值–20 dB相吻合,不考虑馈线损耗–0.2 dB时,天线口面效率为77.9%,接近设计值80%。旁瓣电平依次递减,旁瓣之间具有清晰的零深点,与设计的远角旁瓣特征相吻合。

    工作频带内,相对于多喇叭多波束馈源,致密焦面阵列馈源的5个波束的平均天线效率(不考虑馈线损耗)从64.03%提高到了72.73%,第1副瓣电平平均降低了1.8 dB,边缘波束相对于中心波束的平均增益差从0.47 dB降到了0.37 dB,最大增益差从1.07 dB降到了0.79 dB。

    由于偏离波束的口面电场的相位不一致,随着波束偏离角度的增大,远场辐射方向图半功率波束宽度变宽,天线增益降低,这是不可避免的。但从利用焦面电场初级辐射方向图计算得到的反射面性能结果可以看出,在最高频率、最大波束偏离角处,即最坏的情况下,天线增益相对于中心波束的增益差也仅为0.63 dB。在波束偏离角度不大的情况下,由于波束倾斜造成的口面功率分布改变不大,轴对称口面电场可以实现和可分离口面电场基本相等的天线效率。只是在波束倾斜平面靠近反射面中心一侧的第1旁瓣电平会升高,从表1可以看出,在最高频率1.45 GHz处,50号波束的波束偏离方向一侧的第1旁瓣电平从中心波束的–19.9 dB 升到了–13.7 dB。因此有必要对旁瓣电平较高的局部区域进行处理。

    下面采用辅助波束法降低第1旁瓣电平。如图5(a)所示,50号波束右侧第1旁瓣电平出现在\theta = – 0.1^\circ 处,其相对于该波束峰值点–0.185°处的归一化电场{{\text{E}}_1}0.1613( - 15.8\;{\rm{dB}})\angle 13.5^\circ ,如果在\theta = - 0.1^\circ 处叠加1个电场{\text{E}}_2 = (0.1613 - 0.1( - 20\;{\rm{dB}})){\angle (13.5^\circ \pm 180^\circ ) = 0.0613\angle (13.5^\circ \pm 180^\circ )},则该点的旁瓣电平将接近设计值–20 dB。{{\text{E}}_2}可以由辅助波束来实现。为了让辅助波束尽可能地不改变原有波束其它区域的性能,辅助波束由1个波束指向接近\theta = - 0.1^\circ 的锐波束来实现,辅助波束的阵元数目尽可能少,才能最大程度地不增加原有阵列馈源的复杂度。利用式(3)计算出波束指向为\theta = - 0.1^\circ 的波束在焦平面上的等效相位中心,选取离等效相位中心最近的14号阵元作为辅助波束的馈源,并设定其激励电压{\text{u}} = |{\text{u}}|\angle \delta 后,利用物理光学方法求出辅助波束的辐射场,设50号波束与辅助波束在\theta = - 0.1^\circ 处的电场幅度比为\eta ,相位差为\varphi ,则将14号阵元的激励电压修正为{\text{u}}' = (|{\text{u}}| \cdot 0.0613\eta )\angle (\delta + \varphi \pm {\text{π}} ),并将14号阵元添加到50号波束的阵列馈源中形成修正50号波束,则可以在最大程度地保持原有波束性能的基础上,降低期望位置处的旁瓣电平。图6给出了原始50号波束和修正50号波束的立体辐射方向图。

    图 6  50号波束中心频率的立体远场辐射方向图

    可以看出,靠近天线中心一侧的第1旁瓣电平从–15.8 dB 降到了–18.5 dB,与理论–20.0 dB只有稍许误差,造成这一结果的原因是因为辅助波束仅由14号阵元形成,辅助波束与原始50号波束的信号子空间具有一定的相关性。但可以通过两种方法使旁瓣电平满足–20.0 dB的要求,第1种方法可以通过调整14号阵元的激励电压来实现;第2种方法可以采用多个辅助波束来实现,每个辅助波束由一个独立的阵元产生,多个辅助波束合成的电场实质上是由多个阵元组成的阵列馈源的辐射场。因此按照第2节的设计过程确定每个阵元的位置及激励电压,使合成电场在\theta = - 0.1^\circ 处等于{{\text{E}}_2},且在其它区域具有低的旁瓣电平。这样的处理降低了合成电场与原始50号波束的相关性,因此利用合成电场即可以实现–20.0 dB的旁瓣电平,且由于合成电场具有低的旁瓣电平和更加尖锐的波束形状,合成电场对原始50号波束\theta = - 0.1^\circ 之外的区域影响比第1种方法小,但增加了阵列馈源的复杂度。

    图6中3根虚线将两种情况下部分区域的性能进行了对比,可以看出,相对于中心波束,倾斜波束只在波束倾斜平面内靠近天线中心一侧的第1旁瓣电平增加了,其它平面内的第1旁瓣电平低于中心波束的第1旁瓣电平。和原始50号波束相比较,修正后的50号波束的增益和其它区域的旁瓣电平等几乎没有发生变化。因此一般情况下,采用辅助波束法降低波束倾斜平面内靠近天线中心一侧的第1旁瓣电平后,在整个立体空间,可以获得较好的第1旁瓣电平和远角旁瓣包络。该方法同样可以用来形成波束零深点,抑制在零深点方向的外来同频干扰信号,抑制效果取决于零深点电平的大小。但在同频干扰信号的数目过多、干扰信号方向离波束指向的角度过近的特殊情况下,需要采用其他方法进行设计[21,22]

    本文采用多种处理措施,提出了一种可以快速、稳健地设计致密焦面阵列馈源的方法。入射波口面电场的引入,可以使反射面天线同时具有高增益、低旁瓣、特定的远角旁瓣包络和低的空间噪声等优点,和以反射面最大信噪比为优化目标函数的智能算法[4,9,13]相比,它可以将多个优化目标函数集成到一个或者少量的优化目标函数中,简化了优化过程,提高了计算速度;同时在常规智能算法[9,13,14]中,由于旁瓣电平造成的空间噪声,尤其是远角区域的噪声往往被忽视了,这样势必导致优化出的反射面性能会下降,甚至由于无法满足通信标准中的远角旁瓣电平包络,会造成通信干扰而无法使用,由于入射波口面电场可以控制旁瓣电平,从而解决了常规智能算法中的旁瓣电平,尤其是远角区域旁瓣电平问题;利用焦面电场和洛伦兹互易定理确定阵元数目加快了优化过程,且以初始激励电压值作为参考值,可缩小优化参数的取值范围,进而可以采用简单的循环查找方法,而不需要采用复杂的智能优化算法[9,13,14]或者通过求解庞大的联立方程组[15,16]即可完成优化过程,可以加快运行速度和降低出现奇异结果的概率;和对反射面远场辐射方向图[15,16]上进行采样,再利用最小二乘法[15]或者线性约束最小方差法[16]求解激励电压的方法比较,用阵列馈源初级辐射方向图代替反射面远场辐射方向图作为优化过程中的参量,省去了利用馈源初级辐射方向图计算反射面远场辐射方向图的过程,减轻了运算量。另外,相对于反射面远场辐射方向图,阵列馈源初级辐射方向图形状简单、变化缓慢,可以用更少的参数进行描述,简化了优化目标函数。同时由于阵列馈源初级辐射方向图微小的变化对反射面远场辐射方向图的影响不明显,增强了优化过程的稳健性;结合入射波口面电场,并对反射面远场辐射方向图进行分析,采用辅助波束法只需要对波束倾斜平面内靠近天线中心一侧的第1旁瓣电平进行抑制后,在整个立体空间,可以获得较好的第1旁瓣电平和远角旁瓣包络,这样大大减少了反射面远场辐射方向图采样点数目[15,16],简化了优化过程,提高了优化过程的稳健性。

  • 图  1  谱图特征用于非匹配条件的声音事件分类

    图  2  基于MBPD图的低信噪比声音事件检测

    图  3  茶隼叫声的gammatone频谱图及MBPD

    图  4  图像分块及DCT系数

    图  5  不同Z值的检测率

    图  6  MBPD-DCTZ特征在不同分类器下的检测率

    图  7  风声环境下–10 dB茶隼叫声、纯净茶隼叫声以及风声的波形图、gammatone频谱图和MBPD

    表  1  MBPD-DCTZ特征的交叉验证结果(%)

    信噪比(dB) 噪声环境
    流水 粉噪声 风声 海浪 公路 雨声 平均
    –10 40.0±0.7 65.7±5.1 32.5±3.8 44.7±0.9 52.6±3.8 36.5±3.2 45.3±11.1
    –5 86.1±3.4 91.1±1.7 87.0±3.2 82.9±1.9 91.2±2.1 84.7±2.5 87.2±3.1
    0 91.7±1.9 91.8±1.9 92.3±1.9 91.6±1.4 92.01±2.2 91.5±1.9 91.8±0.3
    5 91.9±1.9 92.2±1.9 92.1±2.3 92.2±1.8 92.3±2.1 92.0±1.9 92.1±0.1
    下载: 导出CSV

    表  3  不同特征对办公室声音事件的检测率(%)

    特征 办公室声音事件 粉噪声信噪比(dB)
    5 0 –5
    LBP 69.7±2.3 70.9±5.1 35.2±0.9 16.4±2.6
    GLCM-SDH 47.3±5.4 44.2±7.5 45.5±5.4 38.8±4.8
    HOG 70.3±5.2 40.6±4.8 33.9±3.1 32.1±2.3
    MFCC 43.7±0.7 27.2±4.7 22.1±4.5 17.6±3.4
    PNCC 47.2±1.9 34.3±2.0 28.1±2.3 22.1±1.8
    MBPD-DCTZ 75.2±0.6 75.2±1.7 75.8±4.3 54.6±5.4
    下载: 导出CSV

    表  2  6种噪声环境下不同特征对动物声音事件的平均检测率(%)

    特征 信噪比(dB)
    5 0 –5 –10
    LBP 64.3±14.3 16.6±10.5 2.8±0.8 2.4±0.9
    GLCM-SDH 41.4±3.5 36.0±4.3 14.6±9.5 4.2±1.7
    HOG 68.9±5.4 28.8±10.5 7.4±5.2 4.1±1.8
    MFCC 17.5±4.8 9.5±2.5 4.7±0.7 3.0±0.8
    PNCC 28.0±0.9 20.0±0.9 9.1±2.0 2.5±0.8
    MBPD-DCTZ 92.1±0.1 91.8±0.3 87.2±3.1 45.3±11.1
    下载: 导出CSV

    表  4  6种噪声环境下不同方法对动物声音事件的平均检测率(%)

    方法 信噪比(dB)
    5 0 –5 –10
    本文方法 92.1±0.1 91.8±0.3 87.2±3.1 45.3±11.1
    MFCC-SVM[22] 25.2±6.0 13.8±4.8 5.7±3.1 3.7±2.0
    MP-SVM[10] 30.0±2.5 16.4±4.0 8.2±2.4 4.6±0.9
    SIF-SVM[13] 61.4±8.5 40.3±12.1 18.9±13.4 9.7±7.7
    SPD-KNN[12] 87.9±1.8 82.7±3.9 45.4±22.1 9.9±8.8
    下载: 导出CSV

    表  5  不同方法对办公室声音事件的检测率(%)

    方法 办公室声音事件 粉噪声信噪比(dB)
    5 0 –5
    本文方法 75.2±0.9 75.2±1.7 75.8±4.3 54.6±5.4
    MFCC-SVM[22] 16.4±1.8 15.8±1.7 17.6±0.9 16.4±3.0
    MP-SVM[10] 62.7±4.2 45.4±2.1 26.0±0.9 14.0±1.4
    SIF-SVM[13] 75.2±2.3 40.6±6.2 31.5±8.2 25.5±1.5
    SPD-KNN[12] 36.4±13.6 28.5±4.8 25.5±5.4 21.8±5.4
    下载: 导出CSV
  • 米建伟, 方晓莉, 仇原鹰. 非平稳背景噪声下声音信号增强技术[J]. 仪器仪表学报, 2017, 38(1): 17–22 doi: 10.3969/j.issn.0254-3087.2017.01.003

    MI Jianwei, FANG Xiaoli, and QIU Yuanying. Enhancement technology for the audio signal with nonstationary background noise[J]. Chinese Journal of Scientific Instrument, 2017, 38(1): 17–22 doi: 10.3969/j.issn.0254-3087.2017.01.003
    汪家冬, 邹采荣, 蒋本聪, 等. 基于数字助听器声音场景分类的噪声抑制算法[J]. 数据采集与处理, 2017, 32(4): 825–830 doi: 10.16337/j.1004-9037.2017.04.021

    WANG Jiadong, ZOU Cairong, JIANG Bencong, et al. Noise reduction algorithm based on acoustic scene classification in digital hearing aids[J]. Journal of Data Acquisition and Processing, 2017, 32(4): 825–830 doi: 10.16337/j.1004-9037.2017.04.021
    FENG Zuren, ZHOU Qing, ZHANG Jun, et al. A target guided subband filter for acoustic event detection in noisy environments using wavelet packets[J]. IEEE/ACM Transactions on Audio,Speech,and Language Processing, 2015, 23(2): 361–372 doi: 10.1109/TASLP.2014.2381871
    GRZESZICK R, PLINGE A, and FINK G A. Bag-of-features methods for acoustic event detection and classification[J]. IEEE/ACM Transactions on Audio,Speech,and Language Processing, 2017, 25(6): 1242–1252 doi: 10.1109/TASLP.2017.2690574
    REN Jianfeng, JIANG Xudong, YUAN Junsong, et al. Sound-event classification using robust texture features for robot hearing[J]. IEEE Transactions on Multimedia, 2017, 19(3): 447–458 doi: 10.1109/TMM.2016.2618218
    YE Jiaxing, KOBAYASHI T, and MURAKAWA M. Urban sound event classification based on local and global features aggregation[J]. Applied Acoustics, 2017, 117: 246–256 doi: 10.1016/j.apacoust.2016.08.002
    CAKIR E, PARASCANDOLO G, HEITTOLA T, et al. Convolutional recurrent neural networks for polyphonic sound event detection[J]. IEEE/ACM Transactions on Audio,Speech,and Language Processing, 2017, 25(6): 1291–1303 doi: 10.1109/TASLP.2017.2690575
    SHARAN R V and MOIR T J. Robust acoustic event classification using deep neural networks[J]. Information Sciences, 2017, 396: 24–32 doi: 10.1016/j.ins.2017.02.013
    OZER I, OZER Z, and FINDIK O. Noise robust sound event classification with convolutional neural network[J]. Neurocomputing, 2018, 272: 505–512 doi: 10.1016/j.neucom.2017.07.021
    WANG Jiaching, LIN Changhong, and CHEN Bowei. Gabor-based nonuniform scale-frequency map for environmental sound classification in home automation[J]. IEEE Transactions on Automation Science and Engineering, 2014, 11(2): 607–613 doi: 10.1109/TASE.2013.2285131
    SHARMA A and KAUL S. Two-stage supervised learning-based method to detect screams and cries in urban environments[J]. IEEE/ACM Transactions on Audio,Speech,and Language Processing, 2016, 24(2): 290–299 doi: 10.1109/TASLP.2015.2506264
    DENNIS J, TRAN H D, and CHNG E S. Image feature representation of the subband power distribution for robust sound event classification[J]. IEEE/ACM Transactions on Audio,Speech,and Language Processing, 2013, 21(2): 367–377 doi: 10.1109/TASL.2012.2226160
    DENNIS J, TRAN H D, and LI Haizhou. Spectrogram image feature for sound event classification in mismatched conditions[J]. IEEE Signal Processing Letters, 2011, 18(2): 130–133 doi: 10.1109/LSP.2010.2100380
    SLANEY M. An efficient implementation of the Patterson-Holdsworth auditory filter bank[R]. Apple Computer Technical Report, 1993.
    PAPAKOSTAS G A, KOULOURIOTIS D E, and KARAKASIS E G. Efficient 2-D DCT Computation from An Image Representation Point of View[M]. London, UK, Intch Open, 2009: 21–34.
    LAY J A and GUAN Ling. Image retrieval based on energy histograms of the low frequency DCT coefficients[C]. IEEE International Conference on Acoustic, Speech and Signal Processing, Arizona, USA, 1999: 3009–3012.
    BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5–32 doi: 10.1023/A:1010933404324
    Universitat Pompeu Fabra. Repository of sound under the creative commons license, Freesound. org[OL]. http://www.freesound.org, 2012.5.14.
    IEEE Signal Processing Society, Tampere University of Technology, Queen Mary University of London, et al. IEEE DCASE 2016 Challenge[OL]. http://www.cs.tut.fi/sgn/arg/dcase2016/, 2016.
    CHANG Chihchung and LIN Chihjen. LIBSVM: A library for support vector machines[J]. ACM Transactions on Intelligent Systems and Technology, 2011, 2(3): 1–27 doi: 10.1145/1961189.1961199
    COVER T and HART P. Nearest neighbor pattern classification[J]. IEEE Transactions on Information Theory, 1967, 13(1): 21–27 doi: 10.1109/TIT.1967.1053964
    ZHENG Fang, ZHANG Guoliang, and SONG Zhanjiang. Comparison of different implementations of MFCC[J]. Journal of Computer Science and Technology, 2001, 16(6): 582–589 doi: 10.1007/BF02943243
    KIM C and STERN R M. Feature extraction for robust speech recognition based on maximizing the sharpness of the power distribution and on power flooring[C]. IEEE International Conference on Acoustic, Speech and Signal Processing, Dallas, USA, 2010: 4574–4577.
    魏静明, 李应. 利用抗噪纹理特征的快速鸟鸣声识别[J]. 电子学报, 2015, 43(1): 185–190 doi: 10.3969/j.issn.0372-2112.2015.01.029

    WEI Jingming and LI Ying. Rapid bird sound recognition using anti-noise texture features[J]. Acta Electronica Sinica, 2015, 43(1): 185–190 doi: 10.3969/j.issn.0372-2112.2015.01.029
    KOBAYASHI T and YE J. Acoustic feature extraction by statictics based local binary pattern for environmental sound classification[C]. IEEE International Conference on Acoustic, Speech and Signal Processing, Florence, Italy, 2014: 3052–3056.
    RAKOTOMAMONJY A and GASSO G. Histogram of gradients of time-frequency representations for audio scene classification[J]. IEEE/ACM Transactions on Audio,Speech,and Language Processing, 2015, 23(1): 142–153 doi: 10.1109/TASLP.2014.2375575
  • 期刊类型引用(1)

    1. 薛裕晓,沈永健,张峪维,李敏,刘昊. 宽带相控阵馈源可展开反射面天线研究. 遥测遥控. 2023(01): 72-78 . 百度学术

    其他类型引用(5)

  • 加载中
图(7) / 表(5)
计量
  • 文章访问数:  2110
  • HTML全文浏览量:  776
  • PDF下载量:  42
  • 被引次数: 6
出版历程
  • 收稿日期:  2018-02-09
  • 修回日期:  2018-07-09
  • 网络出版日期:  2018-07-26
  • 刊出日期:  2018-12-01

目录

/

返回文章
返回