高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

2024年  第46卷  第3期

封面
2024 年 3 期封面
2024, 46(3).
摘要:
目次
2024 年 3 期目次
2024, 46(3): 1-4.
摘要:
综述评论
云边端架构下边缘智能计算关键问题综述:计算优化与计算卸载
董裕民, 张静, 谢昌佐, 李子扬
2024, 46(3): 765-776. doi: 10.11999/JEIT230390
摘要:
近年来,随着入网设备数量与数据体量的急剧增加,以云计算为代表的中心式计算模式的缺点越来越显露出来。边缘计算,即让计算尽量靠近数据源,以减少数据传输时间和网络延迟,作为云计算的补充,已经成为学术界和工业界关注的焦点。该文面向边缘计算中应用较广的实例架构—云边端架构,以及边缘计算的典型应用—边缘智能计算,讨论云边端架构下边缘智能计算的两大关键问题:计算优化和计算卸载。首先分析和梳理了云边端架构下边缘智能计算优化的应用与研究现状。然后讨论了云边端架构下计算卸载的研究思路和现状。最后,总结提出了目前云边端架构下边缘智能计算业务所面临的挑战和未来研究趋势。
智能交通感知新范式:面向元宇宙的交通标志检测架构
王俊帆, 陈毅, 高明煜, 何志伟, 董哲康, 缪其恒
2024, 46(3): 777-789. doi: 10.11999/JEIT230357
摘要:
交通标志检测对智能交通系统和智能驾驶的安全稳定运行具有重要作用。数据分布不平衡、场景单一会对模型性能造成较大影响,而建立一个完备的真实交通场景数据集需要昂贵的时间成本和人工成本。基于此,该文提出一个面向元宇宙的交通标志检测新范式以缓解现有方法对真实数据的依赖。首先,通过建立元宇宙和物理世界之间的场景映射和模型映射,实现检测算法在虚实世界之间的高效运行。元宇宙作为一个虚拟化的数字世界,能够基于物理世界完成自定义场景构建,为模型提供海量多样的虚拟场景数据。同时,该文结合知识蒸馏和均值教师模型建立模型映射,应对元宇宙和物理世界之间存在的数据差异问题。其次,为进一步提高元宇宙下的训练模型对真实驾驶环境的适应性,该文提出启发式注意力机制,通过对特征的定位和学习来提高检测模型的泛化能力。所提架构在CURE-TSD, KITTI, VKITTI数据集上进行实验验证。实验结果表明,所提面向元宇宙的交通标志检测器在物理世界具有优异的检测效果而不依赖大量真实场景,检测准确率达到89.7%,高于近年来其他检测方法。
脑机接口中脑电图-近红外光谱联合分析进展研究
张力新, 周鸿展, 王东, 孟佳圆, 许敏鹏, 明东
2024, 46(3): 790-797. doi: 10.11999/JEIT230257
摘要:
脑机接口(BCI)能将受试者意图相关的大脑活动转化为外部设备控制指令,在神经疾病治疗、运动康复等方面具有较高应用潜力。BCI的实现需从人脑获取有意义的信号,而脑电图(EEG)可以反映神经电活动,主要用于对反映实时性要求较高的BCI系统;近红外光谱(NIRS)主要反映血流动力学水平,一般用于神经生理状态等需要精确定位脑活跃区域的研究。EEG和NIRS因其非侵入、方便穿戴、成本较低等优点,成为BCI的重要信号获取方法。相比于单模态BCI系统,基于EEG-NIRS 联合分析的混合BCI系统由于具有更丰富的信号特征,在生理状态检测、运动想象等领域得到了越来越多的关注与研究。该文从EEG-NIRS联合分析在脑机接口中应用的研究现状出发,在数据和特征融合程度、层面上归纳最近的相关领域研究现状,并对EEG-NIRS信号处理手段的研究前景进行了展望。
无线通信、物联网与数字信号处理
全双工主动窃听非正交多址接入系统智能超表面辅助物理层安全传输技术
阔永红, 曹琳, 吕璐, 贺冰涛, 陈健
2024, 46(3): 798-807. doi: 10.11999/JEIT230296
摘要:
针对全双工被动窃听和主动干扰攻击下的多用户非正交多址接入(NOMA)系统,该文提出一种智能超表面(RIS)辅助的鲁棒波束赋形方案以实现物理层安全通信。考虑在仅已知窃听者统计信道状态信息的条件下,以系统传输中断概率和保密中断概率作为约束,通过联合优化基站发射波束赋形、RIS相移矩阵、传输速率和冗余速率,来最大化系统的保密速率。为解决上述多变量耦合非凸优化问题,提出一种有效的交替优化算法得到联合优化问题的次优解。仿真结果表明,所提方案可实现较高的保密速率,且通过增加RIS反射单元数,系统保密性能更佳。
可重构智能反射面辅助太赫兹通信系统鲁棒波束赋形算法
袁一铭, 徐勇军, 周继华
2024, 46(3): 808-816. doi: 10.11999/JEIT230160
摘要:
太赫兹通信作为6G的关键技术之一,被认为是能够解决频谱资源短缺、提升系统容量的有效手段。然而,由于路径损耗极高和分子的吸收作用,太赫兹容易被障碍物阻挡导致通信中断。为了解决该问题,该文将可重构智能反射面(RIS)引入到太赫兹通信系统中,且考虑信道不确定性对传输稳定性的影响,基于用户服务质量约束、基站发射功率约束及RIS离散相移约束,建立多用户能效最大化波束赋形模型。利用丁克尔巴赫、连续凸近似、S-程序、半正定松弛、相位映射和块坐标下降将原非凸优化问题转化为凸优化问题进行求解。仿真结果表明,与传统非鲁棒波束赋形对比,所提算法能效提升了15.4%,中断概率减小了15.48%。
基于改进自适应IMM算法的高速列车组合定位
王小敏, 雷筱, 张亚东
2024, 46(3): 817-825. doi: 10.11999/JEIT230251
摘要:
针对列车高精度定位问题,该文提出基于改进自适应交互多模型(IMM)的高速列车高精度组合定位方法。首先,根据列车定位需求和各传感器特点,设计了卫星接收器、轮轴测速传感器、测速雷达以及单轴陀螺仪4种传感器的组合定位方案。然后,针对IMM融合滤波算法因先验信息不准导致固定参数设置不当的问题,引入Sage-Husa自适应滤波和转移概率矩阵(TPM)自适应更新集成为自适应IMM算法。针对多模型切换的滞后问题,利用子模型似然函数值能快速反映模型变化趋势的特点,将似然函数值设为判定标志,并引入判定窗对TPM矩阵元素进行修正,有效提升了模型的切换速度。最后,基于改进自适应IMM算法对4种传感器定位信息进行融合滤波,实现高速列车的高精度组合定位。仿真结果表明:改进后的算法相比其他自适应IMM算法提升定位精度1.6%~14.7%,并且能通过提高模型间切换速度来有效降低位置误差峰值,同时具备较好的抗噪性能。
基于多维扩展的正交时序复用波形框架及其性能分析
王震铎, 谭正锋, 孙溶辰
2024, 46(3): 826-834. doi: 10.11999/JEIT230248
摘要:
正交时序复用(OTSM)是一种适用于高速移动场景的低复杂度调制方法。然而,单一的波形设计方法难以满足多样化的应用需求和性能需求。因此,该文基于加权分数傅里叶变换(WFRFT)提出了加权分数沃尔什-哈达玛变换(WFRWHT),并提出了多维扩展的一体化的加权分数傅里叶变换-加权分数沃尔什哈达玛变换-正交时序复用(WFRFT-WFRWHT-OTSM)波形框架。通过对2维参数的灵活配置,该框架可退化为OTSM、正交时频空、混合载波、正交频分复用和单载波等波形,同时研究了采用高斯-赛德尔(GS)迭代均衡时一体化WFRFT-WFRWHT-OTSM波形在时延-多普勒信道下的误码率(BER)性能以及峰均功率比(PAPR)性能。仿真结果表明,在不同时延-多普勒信道下,该框架可通过改变WFRFT和WFRWHT阶次实现更优的BER和PAPR性能。
基于全频谱共享的三维轨迹和功率优化方法
裴二荣, 陈新虎, 陈琪美, 孙远欣, 黎伟
2024, 46(3): 835-847. doi: 10.11999/JEIT230261
摘要:
当前蜂窝系统频谱资源极度短缺,免授权频谱因而被建议在蜂窝系统中使用。无人机(UAV)的飞行轨迹和功率控制对频谱利用效率有重大影响。然而,基于频谱共享的3维轨迹和功率优化方法却鲜少研究。为此,该文首先提出一种全频谱共享方法,即无人机通过控制上行蜂窝用户和设备到设备(D2D)用户的发射功率,在不影响WiFi设备正常传输的前提下使用免授权频谱;同时无人机也能够在不影响其他下行蜂窝用户的前提下使用授权频谱。然后基于提出的全频谱共享方法,该文构建了无人机电池能量约束下的3维飞行轨迹和发射功率的联合优化问题。为了求解提出的复杂多变量耦合的非凸优化问题,该文采用块坐标下降和连续凸逼近方法将原问题转化为3维轨迹优化和功率控制两个凸优化子问题并迭代求解。大量仿真结果证明提出的基于3维轨迹和功率优化的全频谱共享方法能够显著提高频谱利用效率。
基于JAYA算法的紫外光通信无人机编队路由优化
郝锐, 王建萍, 陈丹阳, 路慧敏
2024, 46(3): 848-857. doi: 10.11999/JEIT230206
摘要:
紫外光通信由于其灵活性高、安全性好和全天候工作等优点,被认为是应急通信用无人机编队(UAV)的有潜力通信解决方案。为了提升紫外光通信无人机编队的有效作业时间,该文基于低功耗自适应集簇分层(LEACH)算法,并结合JAYA智能优化算法提出一种新颖的路由优化算法(RJLEACH)。该方法被用来改善紫外光通信无人机编队的有效操作时间。应用该算法对不同结构的紫外光通信无人机编队路由优化,并与其它算法得到的结果进行了比较分析。结果表明,RJLEACH算法在簇首选举阶段降低了无人机节点间的剩余能量方差,并且通过搜索最优路由降低了簇间通信的能量消耗。最终使网络出现第1个死亡节点和出现1/2死亡节点的时间相比经典LEACH算法分别延长了31.8%和13.8%,同时明显提高了能量利用率,能够为灾区救援和应急通信等任务争取宝贵的时间。
智能反射表面辅助的非正交多址接入系统用户分组、波束赋形与相移的优化
雷维嘉, 于顺洪, 雷宏江, 唐宏
2024, 46(3): 858-866. doi: 10.11999/JEIT230329
摘要:
该文研究智能反射表面(IRS)辅助的多天线非正交多址接入(NOMA)网络中用户分组、发送波束赋形、相移等的联合优化问题。系统中1个分组分配1个波束并在组内进行连续干扰消除检测。该文提出一种不依赖于发送波束赋形和IRS相移的用户分组配对策略,将用户分组与其他优化分离,显著降低了优化问题求解的难度和计算复杂度。进一步,联合优化基站发送波束赋形、功率分配和IRS相移矩阵,最小化基站的总发送功率。原始优化问题是一个多变量相互耦合的非凸优化问题,利用松弛变量、连续凸逼近、半定松弛、交替迭代优化等方法将原问题转化为凸问题并求解。仿真结果显示,相较于1个用户1个波束的方案,所提方案在基站天线数较少时性能更优,而在天线数较多时也与该对比方案非常接近,但所提方案的优化计算复杂度更低。而对比采用不同分组算法、随机IRS相移方案、最大比发射方案,以及无IRS的方案,所提方案的性能始终更优。
空间耦合低密度奇偶校验码残差滑窗译码算法
周华, 李子杰
2024, 46(3): 867-874. doi: 10.11999/JEIT230288
摘要:
针对空间耦合低密度奇偶校验(SC-LDPC)码滑窗译码(SWD)算法中错误传播导致的高误码率问题,该文提出基于动态残差的滑窗译码(RSWD)算法。通过在窗口内计算边信息更新前后的残差值,动态选择可靠度最低(残差值最大)的边信息优先更新,降低边信息无效更新的频率,提高窗内译码收敛速度。仿真结果表明:相比于传统SWD算法,RSWD算法在窗口中各位置的误比特数明显降低,抑制错误传播效果明显;在高信噪比(SNR)区域或者低迭代次数的情况下,RSWD算法的误码率性能优于SWD算法;此外,将动态残差应用到消息复用(MR)和窗口扩展(WE)两种窗译码算法中,亦能得到类似结论,提升窗译码性能。
智能反射面辅助的抗干扰安全通信系统鲁棒资源分配算法
席兵, 冯彦博, 邓炳光, 张治中
2024, 46(3): 875-885. doi: 10.11999/JEIT230343
摘要:
为了解决恶意干扰攻击、窃听和不完美信道状态信息造成的通信质量降低和安全性差等问题,该文提出一种智能反射面(IRS)辅助的抗干扰安全通信系统鲁棒资源分配算法。首先,基于合法用户的最小安全速率约束、最大发射功率约束和IRS相移约束,在非法节点不完美信道状态信息、干扰器波束成形向量未知的情况下,构建了一个联合优化基站的波束成形向量、人工噪声的协方差矩阵和IRS的相移矩阵的鲁棒资源分配问题。其次,为了求解该非凸问题,利用交替优化、Cauchy-Schwarz不等式、连续凸逼近和泰勒级数展开等方法,将原问题转化为易于求解的凸优化问题。仿真结果表明,与传统算法相比所提算法能有效提高系统安全性、降低功率开销、提高抗干扰裕度,且在一定信道误差范围内能够减低约35%的保密中断概率,具有较强的鲁棒性。
基于深度学习的下行大规模MIMO OFDM系统的1比特预编码算法
周宸颢, 温利嫄, 钱骅, 康凯
2024, 46(3): 886-894. doi: 10.11999/JEIT230239
摘要:
大规模多输入多输出(MIMO)系统中通过在基站端配备数百根天线,在提高频谱利用效率的同时,也带来了系统成本的增加。本课题组之前提出了一种适用于下行大规模MIMO正交频分复用(OFDM)系统的收敛保证的多载波1比特预编码算法(CG-MC1bit),能够获得较优的系统性能,但相应的计算复杂度较高,阻碍了其在实时系统中的应用。为进一步解决大规模MIMO系统中的成本和功耗问题,该文提出了一个模型驱动的神经网络,在CG-MC1bit算法的基础上迭代展开(Unfolding)得到了一种更加高效的CG-MC1bit-Net算法。具体而言,将迭代算法展开为一个神经网络,并引入可训练的参数来替代前向传播中的高复杂性操作。实验结果表明,该方法能够自动更新参数,与传统的预编码算法相比,收敛速度更快,计算复杂度更低。
基于超球面三元组编码的干扰模式开集识别
高玉龙, 王国强, 王钢
2024, 46(3): 895-905. doi: 10.11999/JEIT230145
摘要:
干扰模式识别是现代军事通信对抗中必不可少的一环,随着复杂电磁环境当中各种新型恶意干扰样式层出不穷,对于未知型干扰的判决也变得愈发重要。因此,要求干扰模式识别算法保持对于已知型干扰高精度识别的同时,也能够完成对于未知型干扰的判决,以排除未知型恶意干扰的影响。基于此,该文将未知型干扰存在时的干扰模式识别问题建模为开集识别问题,并提出一种基于超球面3元组编码的干扰模式开集识别方法。所提方法基于超球面3元组对输入的时频图像进行降维编码以提高识别精度,然后采用元识别分类器准确地完成干扰模式开集识别任务。通过仿真试验证明该算法在干信比大于–2 dB时能够高效地完成开放空间中的干扰模式识别任务。
欠采样下的多频带通信信号高精度载频估计
黄翔东, 宋金水, 李燕平
2024, 46(3): 906-913. doi: 10.11999/JEIT230297
摘要:
为根本解决当前主流的基于调制宽带转化器(MWC )的欠采样频率估计方法存在的3个问题,即采样通道数目多、载频估计精度低、信源频带分布稀疏度条件高,该文提出基于互素谱相位差校正的通信信号载频估计方法。通过将两路互素欠采样取代多路调制宽带转化器欠采样,克服了其耗费欠采样通道数目多的缺陷;基于此,既推导出全景谱谱峰位置与两路互素输出IDFT支路序号对的映射关系,又推导出相邻快拍下该序号对的IDFT相位差与载频值的解析关系,从而克服了主流方法的载频估计精度低的缺陷;通过将最小尺寸全相位滤波器对半分解方法融入原型滤波器设计,构造出两路并行互素谱分析器,还彻底克服了对信源频带分布稀疏度条件高的依赖。仿真表明,相比于主流方法,该文方法仅需耗费不足其1/2的样本数量,载频估计的相对误差降至其1/20以下。
智能反射面增强的全双工环境反向散射通信系统波束成形算法
张晓茜, 徐勇军, 吴翠先, 黄崇文
2024, 46(3): 914-924. doi: 10.11999/JEIT230356
摘要:
当前传统环境反向散射通信存在双重衰落、障碍物阻挡和网络容量有限的问题。智能反射面(RIS)作为6G的关键候选技术因能够主动改善信号传输质量、提升通信系统传输性能而备受关注。为此,该文将RIS与全双工技术引入到环境反向散射通信系统,研究了考虑硬件损伤与RIS离散相移的RIS增强全双工环境反向散射通信系统波束成形算法。首先,考虑反射节点最小能量收集与服务质量约束、功率站最大发射功率约束和RIS相移约束,建立了总发射功率最小的波束成形优化问题。然后,利用交替优化、半正定松弛、变量替换、半正定规划将原非凸问题转化成可求解的凸优化问题。最后,仿真结果表明,所提算法比传统波束成形方法平均功耗降低了7.8%。
定向接收低冲突率水声网络媒体接入控制协议
郑茂醇, 韩笑, 葛威, 孙瑶, 殷敬伟
2024, 46(3): 925-933. doi: 10.11999/JEIT230153
摘要:
在全向水声通信网络场景中,较大的传播时延和较高的数据包碰撞率严重影响了网络性能。相比全向接收技术,声矢量传感器的声压和振速通过线性加权组合可以形成单边指向性,实现定向接收某个方向上的信号,进而提高网络的空间复用率。该文首先分析了声矢量传感器定向接收模式下的网络中断概率,验证定向接收技术网络应用的可行性。然后,提出了定向接收低冲突概率媒体接入控制协议(DRLCP-MAC)。该协议利用指向性接收波束握手机制建立稳定的数据传输链路,通过状态转移策略构建多对并行通信链路,缩小虚拟载波监听范围,提高网络的空间复用度。仿真结果表明,与水下冲突避免多址接入协议(MACA-U)和时隙地面多址接入协议(Slotted-FAMA)相比,DRLCP-MAC协议使信道接入成本降低了约50%和60%,网络吞吐量提升了约60%和400%,端到端时延降低了约50%和85%。
考虑信息年龄的无人机辅助智能交通系统计算卸载优化
钟伟锋, 黄旭民, 康嘉文, 谢胜利
2024, 46(3): 934-943. doi: 10.11999/JEIT230459
摘要:
该文考虑无人机(UAV)交通监测与移动边缘计算(MEC)技术结合的智能交通系统。为了保障系统中数据时效性并且降低系统能耗,提出计及信息年龄(AoI)的UAV计算卸载优化方法。首先,建立UAV辅助的MEC系统模型,允许MEC服务器缓存常用的应用程序并为UAV提供计算卸载,以支持UAV执行交通监测任务。通过联合优化UAV任务卸载决策、UAV上下行通信带宽分配以及被卸载任务的计算资源分配,最小化所有UAV与MEC服务器的总能耗,同时满足AoI与资源容量等约束条件。其次,系统能耗最小化问题是混合整数非凸优化问题,因此采用离散化和线性化手段,快速获得问题的近似最优解,并设计离散点生成算法来调节近似误差。最后,仿真结果表明,即使对于大型的非凸问题,所提方法也能够快速得到近似最优解,并且可以在不同的任务场景中满足AoI等约束条件,最大限度降低系统能耗。仿真结果验证了所提方法的有效性。
电磁场与电磁波技术
宽带复合双基地雷达舰船目标长度估计方法
艾小锋, 邱梦奇, 胡旖航, 徐志明, 赵锋
2024, 46(3): 944-951. doi: 10.11999/JEIT230088
摘要:
舰船目标长度特征对舰船目标识别具有重要作用,该文提出一种基于宽带复合双基地雷达联合观测的舰船目标长度估计方法。该方法综合利用单/双基地雷达高分辨距离像(HRRPs)长度,结合双基地雷达-舰船之间的空间关系求解,实现了单次测量估计舰船目标的实际长度,并分析了各种误差因素和几何构型条件下的估计误差。典型场景动态仿真证明了所提方法的有效性,结果表明在高分辨距离像长度误差小于5%条件下,舰船目标长度估计误差小于5%,为舰船目标特征提取与识别提供了新思路。
基于空时级联单脉冲的多目标高效参数估计算法
沈明威, 张永舒, 李建霓, 吴迪, 朱岱寅
2024, 46(3): 952-959. doi: 10.11999/JEIT230347
摘要:
比幅单脉冲最大似然算法(ACM-ML)在进行目标参数估计时需要进行距离与速度的2维松弛迭代搜索,导致了计算效率低、运算量大的问题。针对上述问题,该文提出一种基于空时级联单脉冲的高效多目标参数估计算法(M-STCMP算法)。该算法将单脉冲概念引入脉冲域,利用时域单脉冲计算目标速度,避免了ACM-ML算法中对速度的迭代搜索,将2维松弛迭代搜索降为1维搜索,有效降低了计算复杂度。考虑时域单脉冲无法同时匹配分布在不同时域主波束的速度各异的多个检测目标,进一步利用目标信号的多普勒信息,在各多普勒单元分别进行时域单脉冲测速,并搜索目标距离值。最后为抑制目标间的信号泄露,将所有目标的估计参数进行级联迭代获得高精度参数估计值。理论分析和仿真结果验证了M-STCMP算法的有效性。
一种用于射频识别阅读器的双频宽带圆极化天线
王丽黎, 高智勇, 杜忠红, 徐亚妮
2024, 46(3): 960-966. doi: 10.11999/JEIT230321
摘要:
该文设计了一种紧凑的用作射频识别(RFID)阅读器的双频宽带圆极化天线。天线由弯折处理的矩形贴片、L形贴片和三角形地板构成,通过微带线进行馈电。两个辐射贴片分别独立控制高低两个频段,其轴比带宽也可独立调整,三角形地板可以使横向电流和纵向电流发生变化,从而改变横向电流和纵向电流的比值大小,实现圆极化性能。天线尺寸为0.92\begin{document}$ {\lambda _0} $\end{document}×0.92\begin{document}$ {\lambda _0} $\end{document}×0.0064\begin{document}$ {\lambda _0} $\end{document} (\begin{document}$ {\lambda _0} $\end{document}为2.40 GHz时的自由空间波长)。测试结果表明在超高频(UHF)频段该天线实现了49%(0.77~1.27 GHz)的阻抗带宽和46%(0.84~1.34 GHz)的轴比带宽,在无线局域网(WLAN)频段实现了47.5%(1.54~2.50 GHz)的阻抗带宽和24.2%(1.96~2.50 GHz)的轴比带宽,可以完整覆盖UHF和WLAN两个频段,具有良好的辐射特性。与其他双频圆极化天线相比,该天线整体结构紧凑、设计简单、避免了使用复杂的馈电网络,且具有较宽的3 dB轴比带宽。
图像与智能信息处理
基于DenseNet和卷积注意力模块的高精度手势识别
赵雅琴, 宋雨晴, 吴晗, 何胜阳, 刘璞秋, 吴龙文
2024, 46(3): 967-976. doi: 10.11999/JEIT230165
摘要:
非接触的手势识别是一种新型人机交互方式,在增强现实(AR)/虚拟现实(VR)、智能家居、智能医疗等方面有着广阔的应用前景,近年来成为一个研究热点。由于需要利用毫米波雷达进行更精确的微动手势识别,该文提出一种新型的基于MIMO毫米波雷达的微动手势识别方法。采用4片AWR1243雷达板级联而成的毫米波级联(MMWCAS)雷达采集手势回波,对手势回波进行时频分析,基于距离-多普勒(RD)图和3D点云检测出人手目标。通过数据预处理,提取手势目标的距离-时间谱图(RTM)、多普勒-时间谱图(DTM)、方位角-时间谱图(ATM)和俯仰角-时间谱图(ETM),更加全面地表征手势的运动特征,并形成混合特征谱图(FTM),对12种微动手势进行识别。设计了基于DenseNet和卷积注意力模块的手势识别网络,将混合特征谱图作为网络的输入,创新性地融合了卷积注意力模块(CBAM),实验表明,识别准确率达到99.03%,且该网络将注意力放在手势动作的前半段,实现了高精度的手势识别。
基于任务感知关系网络的少样本图像分类
郭礼华, 王广飞
2024, 46(3): 977-985. doi: 10.11999/JEIT230162
摘要:
针对关系网络(RN)模型缺乏对分类任务整体相关信息的感知能力的问题,该文提出基于任务感知关系网络(TARN)的小样本学习(FSL)算法。引入模糊C均值(FCM)聚类生成基于任务全局分布的类别原型,同时设计任务相关注意力机制(TCA),改进RN中的1对1度量方式,使得在与类别原型对比时,局部特征聚合了任务全局信息。和RN比,在数据集Mini-ImageNet上,5-way 1-shot和5-way 5-shot设置中的分类准确率分别提高了8.15%和7.0%,在数据集Tiered-ImageNet上,5-way 1-shot和5-way 5-shot设置中的分类准确率分别提高了7.81%和6.7%。与位置感知的关系网络模型比,在数据集Mini-ImageNet上,5-way 1-shot设置中分类准确率也提高了1.24%。与其他小样本图像分类算法性能比较,TARN模型在两个数据集上都获得了最佳的识别精度。该方法将任务相关信息和度量网络模型进行结合可以有效提高小样本图像分类准确率。
基于双阶段元学习的小样本中医舌色域自适应分类方法
卓力, 张雷, 贾童瑶, 李晓光, 张辉
2024, 46(3): 986-994. doi: 10.11999/JEIT230249
摘要:
舌色是中医(TCM)望诊最关注的诊察特征之一。在实际应用中,通过一台设备采集到的舌象数据训练得到的舌色分类模型应用于另一台设备时,由于舌象数据分布特性不一致,分类性能往往急剧下降。为此,该文提出一种基于双阶段元学习的小样本中医舌色域自适应分类方法。首先,设计了一种双阶段元学习训练策略,从源域有标注样本中提取域不变特征,并利用目标域的少量有标注数据对网络模型进行微调,使得模型可以快速适应目标域的新样本特性,提高舌色分类模型的泛化能力并克服过拟合。接下来,提出了一种渐进高质量伪标签生成方法,利用训练好的模型对目标域的未标注样本进行预测,从中挑选出置信度高的预测结果作为伪标签,逐步生成高质量的伪标签。最后,利用这些高质量的伪标签,结合目标域的有标注数据对模型进行训练,得到舌色分类模型。考虑到伪标签中含有噪声问题,采用了对比正则化函数,可以有效抑制噪声样本在训练过程中产生的负面影响,提升目标域舌色分类准确率。在两个自建中医舌色分类数据集上的实验结果表明,在目标域仅提供20张有标注样本的情况下,舌色分类准确率达到了91.3%,与目标域有监督的分类性能仅差2.05%。
多目标跟踪中基于次模优化的轨迹片段生成方法
孙瑾, 杜官明
2024, 46(3): 995-1004. doi: 10.11999/JEIT230208
摘要:
作为智能视觉任务的基础工作,多目标跟踪(MOT)一直是计算机视觉领域具有挑战性的课题之一。遮挡是影响跟踪准确性的主要因素,为此该文采用基于检测跟踪的思想,以轨迹片段为基础进行关联获取目标的完整轨迹;同时,为提高跟踪鲁棒性,该文将轨迹片段的生成问题转化为运筹学中的设施选址问题,并进而提出基于次模优化的轨迹片段生成方法。该方法融合梯度(HOG)和颜色(CN)两个互补特征进行目标表征,并根据运动信息设计权重系数提高目标匹配准确度,最后提出具有约束的次模最大化算法实现全局范围内的数据关联生成轨迹片段。通过在多个基准数据集上的对比实验,表明该文算法在保证性能的同时能有效处理遮挡问题。
基于双路径递归网络与Conv-TasNet的多头注意力机制视听语音分离
兰朝凤, 蒋朋威, 陈欢, 赵世龙, 郭小霞, 韩玉兰, 韩闯
2024, 46(3): 1005-1012. doi: 10.11999/JEIT230260
摘要:
目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型(Conv-TasNet)和双路径递归神经网络(DPRNN),提出多头注意力机制时域视听语音分离(MHATD-AVSS)模型。通过音频编码器与视觉编码器获得音频特征与视频的唇部特征,并采用多头注意力机制将音频特征与视觉特征进行跨模态融合,得到融合视听特征,将其经DPRNN分离网络,获得不同说话者的分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及信噪比(SNR)评价指标,在VoxCeleb2数据集进行实验测试。研究表明,当分离两位、3位或4位说话者的混合语音时,该文方法与传统分离网络相比,SDR提高量均在1.87 dB以上,最高可达2.29 dB。由此可见,该文方法能考虑音频信号的相位信息,更好地利用视觉信息与音频信息的相关性,提取更为准确的音视频特性,获得更好的分离效果。
特征反馈机制优化的超声图像病灶检测算法
丁建睿, 王凌涛, 汤丰赫, 宁春平
2024, 46(3): 1013-1021. doi: 10.11999/JEIT230385
摘要:
该文提出一种基于特征反馈机制的超声图像病灶检测方法,以实现超声病灶的实时精确定位与检测。所提方法由基于特征反馈机制的特征提取网络和基于分治策略的自适应检测头两部分组成。特征反馈网络通过反馈特征选取和加权融合计算,充分学习超声图像的全局上下文信息和局部低级语义细节以提高局部病灶特征的识别能力。自适应检测头对特征反馈网络所提取的多级特征进行分治预处理,通过将生理先验知识与特征卷积相结合的方式对各级特征分别进行病灶形状和尺度特征的自适应建模,增强检测头对不同大小病灶在多级特征下的检测效果。所提方法在甲状腺超声图像数据集上进行了测试,得到了70.3%的AP,99.0%的AP50和88.4%的AP75,实验结果表明,相较于主流检测算法,所提算法能实现更精准的实时超声图像病灶检测和定位。
面向方面情感分析的多通道增强图卷积网络
韩虎, 范雅婷, 徐学锋
2024, 46(3): 1022-1032. doi: 10.11999/JEIT230353
摘要:
传统的基于单通道的特征提取方式,仅使用单一的依赖关系捕获特征,忽略单词间的语义相似性与依赖关系类型信息。尽管基于图卷积网络进行方面情感分析的方法已经取得一定成效,但始终难以同时聚合节点的语义信息和句法结构特征,在整个迭代训练过程中最初的语义特征会逐渐遗失,影响句子最终的情感分类效果。由于缺乏先验知识会导致模型对相关情感词的误解,因此需要引入外部知识来丰富文本信息。目前,如何利用图神经网络(GNN)融合句法和语义特征的方式仍值得深入研究。针对上述问题,该文提出一种多通道增强图卷积网络模型。首先,通过对情感知识和依赖类型增强的句法图进行图卷积操作,得到基于语法的两种表示,与经过多头注意力和图卷积学习到的语义表示进行融合,使多通道的特征能够互补学习。实验结果表明,在5个公开数据集上,准确率和宏F1值优于基准模型。由此可见,依赖类型和情感知识均对增强句法图有重要影响,表明融合语义信息与句法结构的有效性。
基于深层特征差异性网络的图像超分辨率算法
程德强, 袁航, 钱建生, 寇旗旗, 江鹤
2024, 46(3): 1033-1042. doi: 10.11999/JEIT230179
摘要:
传统深层神经网络通常以跳跃连接等方式堆叠深层特征,这种方式容易造成信息冗余。为了提高深层特征信息的利用率,该文提出一种深层特征差异性网络(DFDN),并将其应用于单幅图像超分辨率重建。首先,提出相互投影融合模块(MPFB)提取多尺度深层特征差异性信息并融合,以减少网络传输中上下文信息的损失。第二,提出了差异性特征注意力机制,在扩大网络感受野的同时进一步学习深层特征的差异。第三,以递归的形式连接各模块,增加网络的深度,实现特征复用。将DIV2K数据集作为训练数据集,用4个超分辨率基准数据集对预训练的模型进行测试,并通过与流行算法比较重建的图像获得结果。广泛的实验表明,与现有算法相比,所提算法可以学习到更丰富的纹理信息,并且在主观视觉效果和量化评价指标上都取得最好的排名,再次证明了其鲁棒性和优越性。
正交约束域适应的跨工况滚动轴承剩余使用寿命预测方法
韩延, 林志超, 黄庆卿, 向敏, 文瑞, 张焱
2024, 46(3): 1043-1050. doi: 10.11999/JEIT230274
摘要:
针对跨工况轴承剩余使用寿命(RUL)预测模型的决策边界不明显、特征可辨识性低的问题,该文提出一种正交约束的最大分类器差异方法(MCD_OC)。首先,将采集的轴承原始振动信号进行快速傅里叶变换,得到振动信号的频域信号作为模型的输入;然后,通过卷积神经网络(CNN)和门控循环神经网络(GRU)提取轴承信号的深层时空特征,利用最大分类器差异将源域和目标域特征对齐,并对目标域轴承深层特征进行正交约束,增大无标签目标域样本特征之间的可辨识性;最后,基于轴承寿命数据集开展了跨工况轴承寿命预测对比实验,对该文所提方法进行评估,并在多组实验中取得最优结果。
基于高分辨率类激活映射算法的弱监督目标实时检测
孙辉, 史玉龙, 张健一, 王蕊, 王羽玥
2024, 46(3): 1051-1059. doi: 10.11999/JEIT230268
摘要:
受益于深度学习的发展,目标检测技术在各类视觉任务中得到广泛关注。然而,获取目标的边框标注需要高昂的时间和人工成本,阻碍了目标检测技术在实际场景中的应用。为此,该文在仅使用图像类别标签的基础上,提出一种基于高分辨率类激活映射算法的弱监督目标实时检测方法,降低网络对目标实例标注的依赖。该方法将目标检测细划分为弱监督目标定位和目标实时检测两个子任务。在弱监督定位任务中,该文利用对比层级相关性传播理论设计了一种新颖的高分辨率类激活映射算法(HR-CAM),用于获取高质量目标类激活图,生成目标伪检测标注框。在实时检测任务中,该文选取单镜头多盒检测器(SSD)作为目标检测网络,并基于类激活图设计目标感知损失函数(OA-Loss),与目标伪检测标注框共同监督SSD网络的训练过程,提高网络对目标的检测性能。实验结果表明,该文方法在CUB200和TJAB52数据集上实现了对目标准确高效的检测,验证了该文方法的有效性和优越性。
基于双层孪生神经网络的区块链智能合约分类方法
郭加树, 王琪, 李择亚, 武梦德, 张红霞
2024, 46(3): 1060-1068. doi: 10.11999/JEIT230185
摘要:
当前通过深度学习方法进行区块链智能合约分类的方法越来越流行,但基于深度学习的方法往往需要大量的样本标签数据去进行有监督的模型训练,才能达到较高的分类性能。该文针对当前可用智能合约数据集存在数据类别不均衡以及标注数据量过少会导致模型训练困难,分类性能不佳的问题,提出基于双层孪生神经网络的小样本场景下的区块链智能合约分类方法:首先,通过分析智能合约数据特征,构建了可以捕获较长合约数据特征的双层孪生神经网络模型;然后,基于该模型设计了小样本场景下的智能合约训练策略和分类方法。最后,实验结果表明,该文所提方法在小样本场景下的分类性能优于目前最先进的智能合约分类方法,分类准确率达到94.7%,F1值达到94.6%,同时该方法对标签数据的需求更低,仅需同类型其他方法约20%数据量。
基于多尺度分区有向时空图的步态情绪识别
张家波, 高洁, 黄钟玉, 徐光辉
2024, 46(3): 1069-1078. doi: 10.11999/JEIT230175
摘要:
为了有效获取节点之间在多尺度、远距离以及在时间和空间位置上的依赖关系,以提高对步态情绪识别精度,本文首先提出一种构建分区有向时空图的方法:使用所有帧节点进行构图,然后按区域有向连接。其次,提出一种多尺度分区聚合与分区融合的方法。通过图深度学习对图节点进行更新。并对相似节点特征进行融合。最后,提出一个多尺度分区有向自适应时空图卷积神经网络(MPDAST-GCN)方法。网络通过在时间维度上构建图,获取远距离帧节点特征,并自适应地学习每帧上的特征数据。MPDAST-GCN将输入数据分类成高兴、伤心、愤怒和平常4种情绪类型。并在发布的Emotion-Gait数据集上,相比于目前最先进的方法实现6%的精度提升。
规则压缩模型和灵活架构的Transformer加速器设计
姜小波, 邓晗珂, 莫志杰, 黎红源
2024, 46(3): 1079-1088. doi: 10.11999/JEIT230188
摘要:
基于注意力机制的Transformer模型具有优越的性能,设计专用的Transformer加速器能大幅提高推理性能以及降低推理功耗。Transformer模型复杂性包括数量上和结构上的复杂性,其中结构上的复杂性导致不规则模型和规则硬件之间的失配,降低了模型映射到硬件的效率。目前的加速器研究主要聚焦在解决模型数量上的复杂性,但对如何解决模型结构上的复杂性研究得不多。该文首先提出规则压缩模型,降低模型的结构复杂度,提高模型和硬件的匹配度,提高模型映射到硬件的效率。接着提出一种硬件友好的模型压缩方法,采用规则的偏移对角权重剪枝方案和简化硬件量化推理逻辑。此外,提出一个高效灵活的硬件架构,包括一种以块为单元的权重固定脉动运算阵列,同时包括一种准分布的存储架构。该架构可以高效实现算法到运算阵列的映射,同时实现高效的数据存储效率和降低数据移动。实验结果表明,该文工作在性能损失极小的情况下实现93.75%的压缩率,在FPGA上实现的加速器可以高效处理压缩后的Transformer模型,相比于中央处理器 (CPU)和图形处理器 (GPU)能效分别提高了12.45倍和4.17倍。
基于多维信号特征的无人机探测识别方法
聂伟, 戴琪霏, 杨小龙, 王平, 周牧, 周超
2024, 46(3): 1089-1099. doi: 10.11999/JEIT230302
摘要:
如今,无人机(UAVs)在军用民用领域得到大规模应用,在无人机带来便利的同时也带来了巨大的安全隐患。针对无人机的探测识别技术逐渐成为研究热点,传统的无人机探测方法主要是通过获取雷达回波信号、无人机声音信号和光电信号的方式对无人机进行探测。然而,这类方法往往容易受到环境影响具有一定的局限性,无法对无人机进行精确的定位和识别。该文提出一种基于多维信号特征的无人机识别方法,该方法首先通过自适应三角阈值法从接收到的无线信号中探测并筛选出无人机信号,同时解析获取的无线信号的信道状态信息(CSI)。然后,利用正交匹配追踪算法(OMP)进行参数估计来获取无人机的位置信息对无人机进行定位。最后,提取无人机信号中的盒维数和径向积分双谱(RIB)来对无人机进行分类识别。通过实验,该方法对无人机的3维定位精度小于1 m,对无人机的分类识别精度最高能达到100%。
基于双流-非局部时空残差卷积神经网络的人体行为识别
钱惠敏, 陈实, 皇甫晓瑛
2024, 46(3): 1100-1108. doi: 10.11999/JEIT230168
摘要:
3维卷积神经网络(3D CNN)与双流卷积神经网络(two-stream CNN)是视频中人体行为识别研究的常用架构,且各有优势。该文旨在研究结合两种架构且复杂度低、识别精度高的人体行为识别模型。具体地,该文提出基于通道剪枝的双流-非局部时空残差卷积神经网络(TPNLST-ResCNN),该网络采用双流架构,分别在时间流子网络和空间流子网络采用时空残差卷积神经网络(ST-ResCNN),并采用均值融合算法融合两个子网络的识别结果。进一步地,为了降低网络的复杂度,该文提出了针对时空残差卷积神经网络的通道剪枝方案,在实现模型压缩的同时,可基本保持模型的识别精度;为了使得压缩后网络能更好地学习到输入视频中人体行为变化的长距离时空依赖关系,提高网络的识别精度,该文提出在剪枝后网络的首个残差型时空卷积块前引入一个非局部模块。实验结果表明,该文提出的人体行为识别模型在公共数据集UCF101和HMDB51上的识别准确率分别为98.33%和74.63%。与现有方法相比,该文模型具有参数量小、识别精度高的优点。
密码学与网络信息安全
基于非局域性正交乘积态的动态量子秘密共享方案
宋秀丽, 李闯
2024, 46(3): 1109-1118. doi: 10.11999/JEIT230193
摘要:
当前的量子秘密共享(QSS)存在资源制备开销较大、安全性不强的问题,该文提出一种基于正交乘积态的可验证量子秘密共享方案弥补上述不足,且多方成员能动态地加入或退出秘密共享。该方案将正交乘积态的粒子分成两个序列,第1个序列在多个参与者之间传输,前一个参与者对其执行嵌入份额值的酉算子后传输给下一个参与者,直到全部份额聚合完成;对于另一个序列,只有最后一个参与者(验证者)对接收到的粒子执行Oracle算子。然后,验证者对两个序列中的粒子对执行全局测量,得到秘密值的平方剩余。最后,借鉴Rabin密码中密文与明文之间非单一映射的思想,验证者联合Alice验证测量结果的正确性,并从测量结果确定出秘密值。安全性分析表明,该方案能抵抗常见的外部攻击和内部攻击,且验证过程具有强安全性;由于非局域性正交乘积态以两个序列分开传输,因此增强了秘密重构过程的安全性。性能分析表明,该方案使用正交乘积态作为信息载体,量子资源开销较小,且将正交乘积基的维度从低维拓展到d维,参与者人数能动态地增加和减少,使得方案具有更好的灵活性和通用性。
一种面向联邦学习对抗攻击的选择性防御策略
陈卓, 江辉, 周杨
2024, 46(3): 1119-1127. doi: 10.11999/JEIT230137
摘要:
联邦学习(FL)基于终端本地的学习以及终端与服务器之间持续地模型参数交互完成模型训练,有效地解决了集中式机器学习模型存在的数据泄露和隐私风险。但由于参与联邦学习的多个恶意终端能够在进行本地学习的过程中通过输入微小扰动即可实现对抗性攻击,并进而导致全局模型输出不正确的结果。该文提出一种有效的联邦防御策略-SelectiveFL,该策略首先建立起一个选择性联邦防御框架,然后通过在终端进行对抗性训练提取攻击特性的基础上,在服务器端对上传的本地模型更新的同时根据攻击特性进行选择性聚合,最终得到多个适应性的防御模型。该文在多个具有代表性的基准数据集上评估了所提出的防御方法。实验结果表明,与已有研究工作相比能够提升模型准确率提高了2%~11%。
基于混沌理论与DNA动态编码的卫星图像加密算法
肖嵩, 陈哲, 杨亚涛, 马英杰, 杨腾
2024, 46(3): 1128-1137. doi: 10.11999/JEIT230203
摘要:
针对卫星图像在传输、存储过程中涉及的信息安全问题,该文提出一种新型的基于混沌理论与DNA动态编码的卫星图像加密算法。首先,提出一种改进型无限折叠混沌映射,拓宽了原有无限折叠混沌映射的混沌区间。之后,结合改进型Chebyshev混沌映射与SHA-256哈希算法,生成加密算法的密钥流,提升算法的明文敏感性。然后,利用混沌系统的状态值对Hilbert局部置乱后的像素进行DNA编码,实现DNA动态编码,解决了DNA编码规则较少所带来的容易受到暴力攻击的弱点。最后,使用混沌序列完成进一步混沌加密,从而彻底混淆原始像素信息,增加加密算法的随机性与复杂性,得到密文图像。实验结果表明,该算法具有较好的加密效果和应对各种攻击的能力。
电路与系统设计
分数阶光敏神经元的动力学特性分析及其同步研究
杨宁宁, 孟诗悦, 吴朝俊
2024, 46(3): 1138-1146. doi: 10.11999/JEIT230283
摘要:
神经元是神经系统的基本单位,神经元模型的准确性影响对其本质特征的分析和理解。该文研究了由分数阶电容和电感构成的分数阶光敏FitzHugh-Nagumo(FHN)神经元电路。利用分岔图、相轨迹图和时间序列图分析了分数阶光敏神经元模型的动力学特性。研究发现,随着分数阶阶次的降低,分数阶光敏神经元的活跃度增加。当选取不同参数时,神经元系统可以诱发不同的放电模式,如周期放电态、混沌放电态和尖峰放电态。此外,利用电突触耦合的方式连接两个分数阶光敏神经元。通过调整耦合强度,可以实现分数阶光敏神经元系统之间的相位同步和完全同步。最后,采用dSPACE验证了外部光信号对神经元兴奋性的调制作用。