邮件订阅
2023年 第45卷 第10期
显示方式:
2023, 45(10): 3439-3457.
doi: 10.11999/JEIT221051
摘要:
手语识别(SLR)技术是打破听障人群与健听人群间交流壁垒的重要技术手段。该文综述了近几年的手语数据集、评价指标以及手语识别方法。首先,系统梳理了手语数据集并分析了手语识别方法的数据集发展方向。其次,详细介绍了手语识别方法的评价指标。然后,根据手语表达内容、手语识别方法所采用的特征分类总结分析了孤立词手语识别方法与连续语句识别方法、仅依靠手部特征的手语识别方法与多特征融合的手语识别方法。最后探讨了手语识别技术面临的挑战及其发展方向。
手语识别(SLR)技术是打破听障人群与健听人群间交流壁垒的重要技术手段。该文综述了近几年的手语数据集、评价指标以及手语识别方法。首先,系统梳理了手语数据集并分析了手语识别方法的数据集发展方向。其次,详细介绍了手语识别方法的评价指标。然后,根据手语表达内容、手语识别方法所采用的特征分类总结分析了孤立词手语识别方法与连续语句识别方法、仅依靠手部特征的手语识别方法与多特征融合的手语识别方法。最后探讨了手语识别技术面临的挑战及其发展方向。
2023, 45(10): 3458-3467.
doi: 10.11999/JEIT221449
摘要:
基于运动意图的脑-机接口(BCI)对人体运动功能增强、替代和康复具有重要研究意义与应用价值。其中,运动想象(MI)是最常用的表征运动意图的BCI范式。然而,传统MI-BCI通常仅实现不同肢体部位运动意图解码,且识别正确率较低,制约着精细运动控制与康复效果。针对上述问题,近年来研究者在单一肢体特定部位、运动学与动力学意图诱发头皮脑电编解码以及运动意图错误相关电位检测3个方面开展了一系列有意义的探索,并在高自由度的运动指令控制和面向卒中患者的临床康复应用方面取得了较大的研究成果。该文从运动意图的头皮脑电(EEG)编解码相关范式及其BCI应用两个方面综述了本领域研究进展,并探讨当前研究存在的问题和可能的解决方案,以期促进运动意图BCI技术的深入研究及开发应用。
基于运动意图的脑-机接口(BCI)对人体运动功能增强、替代和康复具有重要研究意义与应用价值。其中,运动想象(MI)是最常用的表征运动意图的BCI范式。然而,传统MI-BCI通常仅实现不同肢体部位运动意图解码,且识别正确率较低,制约着精细运动控制与康复效果。针对上述问题,近年来研究者在单一肢体特定部位、运动学与动力学意图诱发头皮脑电编解码以及运动意图错误相关电位检测3个方面开展了一系列有意义的探索,并在高自由度的运动指令控制和面向卒中患者的临床康复应用方面取得了较大的研究成果。该文从运动意图的头皮脑电(EEG)编解码相关范式及其BCI应用两个方面综述了本领域研究进展,并探讨当前研究存在的问题和可能的解决方案,以期促进运动意图BCI技术的深入研究及开发应用。
2023, 45(10): 3468-3482.
doi: 10.11999/JEIT221402
摘要:
水下图像目标检测是水下智能化探测的核心技术之一,广泛应用于工业及军事领域。深度学习相关技术的突破为水下图像目标检测的发展带来了新的机遇,但是目前该领域的综述较为陈旧,并且缺乏一定的系统性和全面性。该文对基于深度学习的水下可见光图像和声呐图像目标检测研究工作进行了详细总结与分析。首先,对基于深度学习的通用目标检测算法框架进行了梳理,包含骨干网络、颈部模块、检测头部、训练算法、推理策略、数据集6项要素,并系统性地总结了每个要素存在的问题及最新研究工作;然后,调研了水下可见光图像目标检测最新进展,分别从数据集发展、模型设计、训练算法进行总结;同时,归纳并分析了水下声呐图像目标检测相关工作,包含前视、侧扫、合成孔径3种声呐。最后,结合深度学习最新研究探讨了该领域的研究趋势。
水下图像目标检测是水下智能化探测的核心技术之一,广泛应用于工业及军事领域。深度学习相关技术的突破为水下图像目标检测的发展带来了新的机遇,但是目前该领域的综述较为陈旧,并且缺乏一定的系统性和全面性。该文对基于深度学习的水下可见光图像和声呐图像目标检测研究工作进行了详细总结与分析。首先,对基于深度学习的通用目标检测算法框架进行了梳理,包含骨干网络、颈部模块、检测头部、训练算法、推理策略、数据集6项要素,并系统性地总结了每个要素存在的问题及最新研究工作;然后,调研了水下可见光图像目标检测最新进展,分别从数据集发展、模型设计、训练算法进行总结;同时,归纳并分析了水下声呐图像目标检测相关工作,包含前视、侧扫、合成孔径3种声呐。最后,结合深度学习最新研究探讨了该领域的研究趋势。
2023, 45(10): 3483-3491.
doi: 10.11999/JEIT221244
摘要:
基于深度学习的多视角立体几何(MVS)旨在通过多个视图重建出稠密的3维场景。然而现有的方法通常设计复杂的2D网络模块来学习代价体聚合的跨视角可见性,忽略了跨视角2维上下文特征在3D深度方向的一致性假设。此外,基于多阶段的深度推断方法仍需要较高的深度采样率,并且在静态或预先设定的范围内采样深度值,容易在物体边界以及光照遮挡等区域产生错误的深度推断。为了缓解这些问题,该文提出一种基于边缘辅助极线Transformer的密集深度推断模型。与现有工作相比,具体改进如下:将深度回归转换为多深度值分类进行求解,在有限的深度采样率和GPU占用下保证了推断精度;设计一种极线Transformer模块提高跨视角代价体聚合的可靠性,并引入边缘检测分支约束边缘特征在极线方向的一致性;为了提高弱纹理区域的精度,设计了基于概率成本体积的动态深度范围采样机制。与主流的方法在公开的数据集上进行了综合对比,实验结果表明所提模型能够在有限的显存占用下重建出稠密准确的3D场景。特别地,相比于Cas-MVSNet,所提模型的显存占用降低了35%,深度采样率降低约50%,DTU数据集的综合误差从0.355降低至0.325。
基于深度学习的多视角立体几何(MVS)旨在通过多个视图重建出稠密的3维场景。然而现有的方法通常设计复杂的2D网络模块来学习代价体聚合的跨视角可见性,忽略了跨视角2维上下文特征在3D深度方向的一致性假设。此外,基于多阶段的深度推断方法仍需要较高的深度采样率,并且在静态或预先设定的范围内采样深度值,容易在物体边界以及光照遮挡等区域产生错误的深度推断。为了缓解这些问题,该文提出一种基于边缘辅助极线Transformer的密集深度推断模型。与现有工作相比,具体改进如下:将深度回归转换为多深度值分类进行求解,在有限的深度采样率和GPU占用下保证了推断精度;设计一种极线Transformer模块提高跨视角代价体聚合的可靠性,并引入边缘检测分支约束边缘特征在极线方向的一致性;为了提高弱纹理区域的精度,设计了基于概率成本体积的动态深度范围采样机制。与主流的方法在公开的数据集上进行了综合对比,实验结果表明所提模型能够在有限的显存占用下重建出稠密准确的3D场景。特别地,相比于Cas-MVSNet,所提模型的显存占用降低了35%,深度采样率降低约50%,DTU数据集的综合误差从0.355降低至0.325。
2023, 45(10): 3492-3501.
doi: 10.11999/JEIT220960
摘要:
主偏度分析(PSA)作为主成分分析(PCA)的一种3阶推广,常用于盲图像分离、SAR图像去噪以及高光谱特征提取等。但现有PSA算法只能得到近似解,这会影响图像后续处理的精度。针对这一问题,该文在现有PSA算法基础上,提出了一种高精度并行主偏度分析(PPSA)算法。PPSA算法充分考虑数据结构,选用协偏度张量的全部切片的特征向量作为迭代的初始值,可以准确地得到实际解。仿真实验以及实际遥感图像实验验证了PPSA算法的有效性与优越性。
主偏度分析(PSA)作为主成分分析(PCA)的一种3阶推广,常用于盲图像分离、SAR图像去噪以及高光谱特征提取等。但现有PSA算法只能得到近似解,这会影响图像后续处理的精度。针对这一问题,该文在现有PSA算法基础上,提出了一种高精度并行主偏度分析(PPSA)算法。PPSA算法充分考虑数据结构,选用协偏度张量的全部切片的特征向量作为迭代的初始值,可以准确地得到实际解。仿真实验以及实际遥感图像实验验证了PPSA算法的有效性与优越性。
2023, 45(10): 3502-3510.
doi: 10.11999/JEIT221041
摘要:
帕金森病是一种常见的慢性神经系统疾病,构音障碍是帕金森病的早期症状之一。基于语音进行帕金森病的辅助诊疗有助于更早发现病情和观测病情的发展。传统方法常通过对语音特征(如频率微扰、振幅微扰等)的参数计算来进行疾病评估,然而这些特征可能无法全面反映所有的病理现象,从而影响了检测和评估的准确率。为更好地提取帕金森病患者语音中的病理信息,提升检测和评估的准确率,该文提出一种基于掩蔽自监督语音特征提取的帕金森病检测方法。首先,从帕金森病患者的原始语音中提取Mel语谱图特征,得到患者富含病理特征的全局时序化表示;然后,对部分Mel语谱图特征进行掩蔽,并通过掩蔽自监督模型对掩蔽部分进行重构,从而学习到帕金森病患者语音特征的更高级表示。为解决帕金森病语音数据稀缺的问题,该文先在LibriSpeech公开数据集上进行掩蔽自监督模型的预训练,然后基于迁移学习的思想,利用帕金森病语音数据对预训练好的掩蔽自监督模型进行微调和加权求和,以提升该模型特征表示学习的性能。最终,使用随机森林和支持向量机分类器分别对提取好的语音特征进行分类,以实现帕金森病的检测。该文在MaxLittle公开数据集和课题组自采数据集上,采用10折交叉验证的方法验证了所提方法的有效性。结果表明,与传统的Mel语谱图特征检测方法和其他经典的自监督特征提取方法相比,所提方法在准确率、敏感度、特异度性能方面均有明显提升。
帕金森病是一种常见的慢性神经系统疾病,构音障碍是帕金森病的早期症状之一。基于语音进行帕金森病的辅助诊疗有助于更早发现病情和观测病情的发展。传统方法常通过对语音特征(如频率微扰、振幅微扰等)的参数计算来进行疾病评估,然而这些特征可能无法全面反映所有的病理现象,从而影响了检测和评估的准确率。为更好地提取帕金森病患者语音中的病理信息,提升检测和评估的准确率,该文提出一种基于掩蔽自监督语音特征提取的帕金森病检测方法。首先,从帕金森病患者的原始语音中提取Mel语谱图特征,得到患者富含病理特征的全局时序化表示;然后,对部分Mel语谱图特征进行掩蔽,并通过掩蔽自监督模型对掩蔽部分进行重构,从而学习到帕金森病患者语音特征的更高级表示。为解决帕金森病语音数据稀缺的问题,该文先在LibriSpeech公开数据集上进行掩蔽自监督模型的预训练,然后基于迁移学习的思想,利用帕金森病语音数据对预训练好的掩蔽自监督模型进行微调和加权求和,以提升该模型特征表示学习的性能。最终,使用随机森林和支持向量机分类器分别对提取好的语音特征进行分类,以实现帕金森病的检测。该文在MaxLittle公开数据集和课题组自采数据集上,采用10折交叉验证的方法验证了所提方法的有效性。结果表明,与传统的Mel语谱图特征检测方法和其他经典的自监督特征提取方法相比,所提方法在准确率、敏感度、特异度性能方面均有明显提升。
2023, 45(10): 3511-3519.
doi: 10.11999/JEIT221034
摘要:
可调谐二极管激光吸收光谱层析成像(TDLAT)是一种重要的光学非侵入式燃烧诊断技术,可实现燃烧场2维横截面气体温度和浓度等流场参数分布的重建。该文将视觉Transformer(ViT)与多尺度特征融合引入TDLAT领域,研究有限数量测量数据与整个测量空间温度分布的非线性映射,提出基于级联ViT与多尺度特征融合的燃烧场温度层析成像网络(HVTMFnet)。该网络提取并融合TDLAT测量数据的局部-全局相关特征,实现整个测量空间的层次化温度分布重建。仿真实验与实际TDLAT系统实验均表明,HVTMFnet重建图像的质量优于现有的基于卷积神经网络(CNN)和基于残差网络的温度层析成像方案。与基于CNN的温度层析成像方案相比,HVTMFnet的重建误差能够降低49.2%~72.1%。
可调谐二极管激光吸收光谱层析成像(TDLAT)是一种重要的光学非侵入式燃烧诊断技术,可实现燃烧场2维横截面气体温度和浓度等流场参数分布的重建。该文将视觉Transformer(ViT)与多尺度特征融合引入TDLAT领域,研究有限数量测量数据与整个测量空间温度分布的非线性映射,提出基于级联ViT与多尺度特征融合的燃烧场温度层析成像网络(HVTMFnet)。该网络提取并融合TDLAT测量数据的局部-全局相关特征,实现整个测量空间的层次化温度分布重建。仿真实验与实际TDLAT系统实验均表明,HVTMFnet重建图像的质量优于现有的基于卷积神经网络(CNN)和基于残差网络的温度层析成像方案。与基于CNN的温度层析成像方案相比,HVTMFnet的重建误差能够降低49.2%~72.1%。
2023, 45(10): 3520-3528.
doi: 10.11999/JEIT221180
摘要:
新冠(COVID-19)肺炎严重威胁人类健康,基于深度学习的计算机辅助诊断方法能有效提高新冠肺炎的诊断效率。但是深度学习模型结构复杂、参数量和计算量大,在保持模型性能的前提下提高网络轻量化的程度具有重要研究意义,因此,该文提出一种面向CT图像新冠肺炎识别的密集重参轻量化Transformer模型(DRLTransformer)。首先,为提高模型的轻量化程度,构造了重参密集块和层次化Transformer,在保持模型精度的同时提高计算速度,降低模型参数量;然后,为充分提取新冠肺炎病灶的全局与局部信息,设计层次化Transformer增强全局注意力对局部特征相关性的关注程度,其中采用分组提取全局特征,在不同组之间进行融合获得多层次信息,并且进行信息融合,进一步提高组内和组间特征的交互能力,此外对所有全局特征进行聚合,实现深浅层特征深度融合。最后,在新冠肺炎CT数据集中进行对比实验,结果表明该模型参数量和计算量分别为1.47 M和81.232 M,相比密集网络(DenseNet)参数量降低29倍、计算量降低23倍,该模型对新冠肺炎计算机辅助诊断具有积极的意义,为深度学习模型轻量化提供了新思路。
新冠(COVID-19)肺炎严重威胁人类健康,基于深度学习的计算机辅助诊断方法能有效提高新冠肺炎的诊断效率。但是深度学习模型结构复杂、参数量和计算量大,在保持模型性能的前提下提高网络轻量化的程度具有重要研究意义,因此,该文提出一种面向CT图像新冠肺炎识别的密集重参轻量化Transformer模型(DRLTransformer)。首先,为提高模型的轻量化程度,构造了重参密集块和层次化Transformer,在保持模型精度的同时提高计算速度,降低模型参数量;然后,为充分提取新冠肺炎病灶的全局与局部信息,设计层次化Transformer增强全局注意力对局部特征相关性的关注程度,其中采用分组提取全局特征,在不同组之间进行融合获得多层次信息,并且进行信息融合,进一步提高组内和组间特征的交互能力,此外对所有全局特征进行聚合,实现深浅层特征深度融合。最后,在新冠肺炎CT数据集中进行对比实验,结果表明该模型参数量和计算量分别为1.47 M和81.232 M,相比密集网络(DenseNet)参数量降低29倍、计算量降低23倍,该模型对新冠肺炎计算机辅助诊断具有积极的意义,为深度学习模型轻量化提供了新思路。
2023, 45(10): 3529-3537.
doi: 10.11999/JEIT221204
摘要:
多模态医学图像能够有效融合解剖图像和功能图像的信息,将人体内部的功能、解剖等多方面信息反映在同一幅图像上,在临床上有十分重要的意义。针对如何高效利用多模态医学图像信息的综合表达能力,以及如何充分提取跨尺度上下文信息的问题,该文提出跨模态跨尺度跨维度的PET/CT图像的Transformer分割模型。该模型主要改进是,首先,在编码器部分设计了PET/CT主干分支和PET, CT辅助分支提取多模态图像信息;然后,在跳跃连接部分设计了跨模态跨维度注意力模块从模态和维度角度出发捕获跨模态图像各维的有效信息;其次,在瓶颈层构造跨尺度Transformer模块,自适应融合深层的语义信息和浅层的空间信息使网络学习到更多的上下文信息,并从中获取跨尺度全局信息;最后,在解码器部分提出多尺度自适应解码特征融合模块,聚合并充分利用解码路径得到精细程度不同的多尺度特征图,缓解上采样引入的噪声。在临床多模态肺部医学图像数据集验证算法的有效性,结果表明所提模型对于肺部病灶分割的Acc, Recall, Dice, Voe, Rvd和Miou分别为97.99%, 94.29%, 95.32%, 92.74%, 92.95%和90.14%,模型对于形状复杂的病灶分割具有较高的精度和相对较低的冗余度。
多模态医学图像能够有效融合解剖图像和功能图像的信息,将人体内部的功能、解剖等多方面信息反映在同一幅图像上,在临床上有十分重要的意义。针对如何高效利用多模态医学图像信息的综合表达能力,以及如何充分提取跨尺度上下文信息的问题,该文提出跨模态跨尺度跨维度的PET/CT图像的Transformer分割模型。该模型主要改进是,首先,在编码器部分设计了PET/CT主干分支和PET, CT辅助分支提取多模态图像信息;然后,在跳跃连接部分设计了跨模态跨维度注意力模块从模态和维度角度出发捕获跨模态图像各维的有效信息;其次,在瓶颈层构造跨尺度Transformer模块,自适应融合深层的语义信息和浅层的空间信息使网络学习到更多的上下文信息,并从中获取跨尺度全局信息;最后,在解码器部分提出多尺度自适应解码特征融合模块,聚合并充分利用解码路径得到精细程度不同的多尺度特征图,缓解上采样引入的噪声。在临床多模态肺部医学图像数据集验证算法的有效性,结果表明所提模型对于肺部病灶分割的Acc, Recall, Dice, Voe, Rvd和Miou分别为97.99%, 94.29%, 95.32%, 92.74%, 92.95%和90.14%,模型对于形状复杂的病灶分割具有较高的精度和相对较低的冗余度。
2023, 45(10): 3538-3546.
doi: 10.11999/JEIT221500
摘要:
目前多数的视听分离模型,大多是基于视频特征和音频特征简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,该文针对此问题提出了新的模型。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合稠密光流(Farneback)算法和U-Net网络,提出跨模态融合的光流-视听语音分离(Flow-AVSS)模型。该模型通过Farneback算法和轻量级网络ShuffleNet v2分别提取运动特征和唇部特征,然后将运动特征与唇部特征进行仿射变换,经过时间卷积模块(TCN)得到视觉特征。为充分利用到视觉信息,在进行特征融合时采用多头注意力机制,将视觉特征与音频特征进行跨模态融合,得到融合视听特征,最后融合视听特征经过U-Net分离网络得到分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及源失真比(SDR)评价指标,在AVspeech数据集进行实验测试。研究表明,该文所提方法与纯语音分离网络和仅采用特征拼接的视听分离网络相比,性能上分别提高了2.23 dB和1.68 dB。由此表明,采用跨模态注意力进行特征融合,能更加充分利用各个模态相关性,增加的唇部运动特征,能有效提高视频特征的鲁棒性,提高分离效果。
目前多数的视听分离模型,大多是基于视频特征和音频特征简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,该文针对此问题提出了新的模型。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合稠密光流(Farneback)算法和U-Net网络,提出跨模态融合的光流-视听语音分离(Flow-AVSS)模型。该模型通过Farneback算法和轻量级网络ShuffleNet v2分别提取运动特征和唇部特征,然后将运动特征与唇部特征进行仿射变换,经过时间卷积模块(TCN)得到视觉特征。为充分利用到视觉信息,在进行特征融合时采用多头注意力机制,将视觉特征与音频特征进行跨模态融合,得到融合视听特征,最后融合视听特征经过U-Net分离网络得到分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及源失真比(SDR)评价指标,在AVspeech数据集进行实验测试。研究表明,该文所提方法与纯语音分离网络和仅采用特征拼接的视听分离网络相比,性能上分别提高了2.23 dB和1.68 dB。由此表明,采用跨模态注意力进行特征融合,能更加充分利用各个模态相关性,增加的唇部运动特征,能有效提高视频特征的鲁棒性,提高分离效果。
2023, 45(10): 3547-3557.
doi: 10.11999/JEIT220973
摘要:
针对计算、能量和内存资源受限的矿山物联网设备和大量时延敏感型计算任务需求的智慧矿山场景,该文提出一种能量收集(EH)辅助的矿山物联网智能计算卸载方法。通过采用移动边缘计算(MEC)技术协助矿山物联网设备任务计算,同时利用能量收集技术为能量受限的矿山物联网设备供电。基于Q-learning的智能计算卸载机制实现在不可精确获取矿井系统模型的情况下动态探索最优计算卸载策略。此外,为处理复杂矿井环境下的维度灾难问题并减小策略离散化导致的离散化误差,该文还提出一种基于深度确定性策略梯度(DDPG)的计算卸载机制来进一步提高井下任务计算卸载性能。理论分析与仿真结果表明所提机制可降低系统的能量损耗、计算时延和任务处理失败率,有助于保障矿山物联网的安全和高效生产。
针对计算、能量和内存资源受限的矿山物联网设备和大量时延敏感型计算任务需求的智慧矿山场景,该文提出一种能量收集(EH)辅助的矿山物联网智能计算卸载方法。通过采用移动边缘计算(MEC)技术协助矿山物联网设备任务计算,同时利用能量收集技术为能量受限的矿山物联网设备供电。基于Q-learning的智能计算卸载机制实现在不可精确获取矿井系统模型的情况下动态探索最优计算卸载策略。此外,为处理复杂矿井环境下的维度灾难问题并减小策略离散化导致的离散化误差,该文还提出一种基于深度确定性策略梯度(DDPG)的计算卸载机制来进一步提高井下任务计算卸载性能。理论分析与仿真结果表明所提机制可降低系统的能量损耗、计算时延和任务处理失败率,有助于保障矿山物联网的安全和高效生产。
2023, 45(10): 3558-3567.
doi: 10.11999/JEIT221017
摘要:
为了提高轻型卷积神经网络(CNN)在遥感图像(RSI)场景分类任务中的精度,该文设计一个双注意力(DA)与空间结构(SS)相融合的双知识蒸馏(DKD)模型。首先,构造新的DA模块,将其嵌入到ResNet101与设计的轻型CNN,分别作为教师与学生网络;然后,构造DA蒸馏损失函数,将教师网络中的DA知识迁移到学生网络之中,从而增强其对RSI的局部特征提取能力;最后,构造SS蒸馏损失函数,将教师网络中的语义提取能力以空间结构的形式迁移到学生网络,以增强其对RSI的高层语义表示能力。基于两个标准数据集AID和NWPU-45的对比实验结果表明,在训练比例为20%的情况下,经知识蒸馏之后的学生网络性能分别提高了7.69%和7.39%,且在参量更少的情况下性能也优于其他方法。
为了提高轻型卷积神经网络(CNN)在遥感图像(RSI)场景分类任务中的精度,该文设计一个双注意力(DA)与空间结构(SS)相融合的双知识蒸馏(DKD)模型。首先,构造新的DA模块,将其嵌入到ResNet101与设计的轻型CNN,分别作为教师与学生网络;然后,构造DA蒸馏损失函数,将教师网络中的DA知识迁移到学生网络之中,从而增强其对RSI的局部特征提取能力;最后,构造SS蒸馏损失函数,将教师网络中的语义提取能力以空间结构的形式迁移到学生网络,以增强其对RSI的高层语义表示能力。基于两个标准数据集AID和NWPU-45的对比实验结果表明,在训练比例为20%的情况下,经知识蒸馏之后的学生网络性能分别提高了7.69%和7.39%,且在参量更少的情况下性能也优于其他方法。
2023, 45(10): 3568-3577.
doi: 10.11999/JEIT221113
摘要:
为了改善多用户相关延迟移位键控(CDSK)系统误码率(BER)较高的缺点,该文提出一种基于时隙变换的多用户多载波相关延迟移位键控(TST-MUMC-CDSK)系统。该方案采用置换矩阵对参考信号进行变换达到传输多用户信息的目的。在发送端,复制P次之后的混沌信号与经过希尔伯特变换的正交信号一同经过时隙变换器,产生2N个相互正交的混沌信号来承载2N个用户信息,大大提高了系统的传输速率。该文推导了该系统在加性高斯白噪声(AWGN)信道和瑞利衰落信道(RFC)下的误码率表达式,通过理论分析以及数值仿真验证了理论推导的正确性。仿真结果表明对比于其他同类系统,所提系统在相同误码率的情况下可以节约更多的比特能量,在误码率同为10–2时,该系统所需的信噪比比降噪多用户相关延迟移位键控(NR_MUCDSK)系统低1.5 dB,比无信号间干扰多用户相关延迟移位键控(NISI_MU_CDSK)系统低2.6 dB。该系统具有良好的理论价值,且为实际工程应用提供了良好的参考。
为了改善多用户相关延迟移位键控(CDSK)系统误码率(BER)较高的缺点,该文提出一种基于时隙变换的多用户多载波相关延迟移位键控(TST-MUMC-CDSK)系统。该方案采用置换矩阵对参考信号进行变换达到传输多用户信息的目的。在发送端,复制P次之后的混沌信号与经过希尔伯特变换的正交信号一同经过时隙变换器,产生2N个相互正交的混沌信号来承载2N个用户信息,大大提高了系统的传输速率。该文推导了该系统在加性高斯白噪声(AWGN)信道和瑞利衰落信道(RFC)下的误码率表达式,通过理论分析以及数值仿真验证了理论推导的正确性。仿真结果表明对比于其他同类系统,所提系统在相同误码率的情况下可以节约更多的比特能量,在误码率同为10–2时,该系统所需的信噪比比降噪多用户相关延迟移位键控(NR_MUCDSK)系统低1.5 dB,比无信号间干扰多用户相关延迟移位键控(NISI_MU_CDSK)系统低2.6 dB。该系统具有良好的理论价值,且为实际工程应用提供了良好的参考。
2023, 45(10): 3578-3586.
doi: 10.11999/JEIT220991
摘要:
遥感图像中的目标检测技术是计算机视觉领域的热点研究之一。为了适应遥感图像中的复杂背景和任意方向的目标,主流的目标检测模型均采用旋转检测方法。然而,用于旋转检测的定位损失函数通常存在变化趋势与实际偏斜交并比(Intersection-over-Union, IoU)的变化趋势不一致的问题。为此,该文提出一种新的面向旋转目标检测的双向衰减损失方法。具体而言,该方法通过高斯乘积模拟偏斜IoU,并依据预测位置的偏差从两个方向衰减乘积。双向衰减损失能够反映由位置偏差引起的偏斜IoU变化,其变化趋势与偏斜IoU有着更强的一致性,并且与其他相关方法相比性能更好。在DOTAv1.0数据集上的实验表明,所提方法在多种基底函数和不同精度条件下都是有效的。
遥感图像中的目标检测技术是计算机视觉领域的热点研究之一。为了适应遥感图像中的复杂背景和任意方向的目标,主流的目标检测模型均采用旋转检测方法。然而,用于旋转检测的定位损失函数通常存在变化趋势与实际偏斜交并比(Intersection-over-Union, IoU)的变化趋势不一致的问题。为此,该文提出一种新的面向旋转目标检测的双向衰减损失方法。具体而言,该方法通过高斯乘积模拟偏斜IoU,并依据预测位置的偏差从两个方向衰减乘积。双向衰减损失能够反映由位置偏差引起的偏斜IoU变化,其变化趋势与偏斜IoU有着更强的一致性,并且与其他相关方法相比性能更好。在DOTAv1.0数据集上的实验表明,所提方法在多种基底函数和不同精度条件下都是有效的。
2023, 45(10): 3587-3593.
doi: 10.11999/JEIT220967
摘要:
对于Link-16数据链终端平台在低信噪比(SNR)高动态场景下的多普勒频率偏移问题,该文设计一种新的数据结构,推导了该结构下的克拉默-拉奥下界(CRLB),并在此基础上提出一种联合频域变换与时域自相关运算的分步式频偏估计算法。其基本思想是,首先对接收信号做自相关处理,然后通过频域变换进行最大值索引,结合修正因子得到多普勒频移的粗估计值,再利用时域的改进L&R算法对接收信号进行细估计,根据两步估计算法得到最终的频偏估计值。算法应用蒙特卡罗实验仿真,仿真结果表明,与传统频偏估计算法相比,该算法的归一化均方误差更接近CRLB,在多普勒频偏为[–20 kHz, 20 kHz]时,估计精度可达10–5。在低信噪比环境下,所提算法能达到较为理想的估计效果,适用于Link-16数据链通信。
对于Link-16数据链终端平台在低信噪比(SNR)高动态场景下的多普勒频率偏移问题,该文设计一种新的数据结构,推导了该结构下的克拉默-拉奥下界(CRLB),并在此基础上提出一种联合频域变换与时域自相关运算的分步式频偏估计算法。其基本思想是,首先对接收信号做自相关处理,然后通过频域变换进行最大值索引,结合修正因子得到多普勒频移的粗估计值,再利用时域的改进L&R算法对接收信号进行细估计,根据两步估计算法得到最终的频偏估计值。算法应用蒙特卡罗实验仿真,仿真结果表明,与传统频偏估计算法相比,该算法的归一化均方误差更接近CRLB,在多普勒频偏为[–20 kHz, 20 kHz]时,估计精度可达10–5。在低信噪比环境下,所提算法能达到较为理想的估计效果,适用于Link-16数据链通信。
2023, 45(10): 3594-3602.
doi: 10.11999/JEIT221392
摘要:
为了降低极化码快速简化串行抵消翻转(Fast-SSC-Flip)译码算法的候选翻转比特集合大小,减小搜索复杂度,该文提出一种基于关键翻转集合的极化码Fast-SSC-Flip译码算法。基于快速简化串行抵消(Fast-SSC)译码过程中首位译码错误信息比特有极大的概率落于关键集合(CS)中,以及Fast-SSC-Flip译码算法的候选比特均为码字比特,所提算法利用极化码的生成矩阵得到与CS中信息比特相应的码字比特,并用这些码字比特构建关键翻转集合(CFS)作为候选翻转比特集合。实验结果表明,在使用相同候选比特可靠性度量准则的前提下,在码长\begin{document}$N = 1\;024$\end{document} 及码率\begin{document}$R = 0.5$\end{document} 时,该文所提基于关键翻转集合的Fast-SSC-Flip译码算法相较于传统Fast-SSC-Flip算法在不损失译码性能的情况下,候选翻转集合大小显著降低;相较于新的快速简化串行抵消翻转(N-Fast-SSC-Flip)算法有相近的译码性能,但候选翻转集合至少缩小了77.93%。
为了降低极化码快速简化串行抵消翻转(Fast-SSC-Flip)译码算法的候选翻转比特集合大小,减小搜索复杂度,该文提出一种基于关键翻转集合的极化码Fast-SSC-Flip译码算法。基于快速简化串行抵消(Fast-SSC)译码过程中首位译码错误信息比特有极大的概率落于关键集合(CS)中,以及Fast-SSC-Flip译码算法的候选比特均为码字比特,所提算法利用极化码的生成矩阵得到与CS中信息比特相应的码字比特,并用这些码字比特构建关键翻转集合(CFS)作为候选翻转比特集合。实验结果表明,在使用相同候选比特可靠性度量准则的前提下,在码长
2023, 45(10): 3603-3611.
doi: 10.11999/JEIT220946
摘要:
可重构智能超表面(RIS)可被视为通信网络中具有特殊功能的“中继”来配合非正交多址接入(NOMA)系统构建一种协同的信息传输方案。考虑到未来物联网(IoT)场景下不同用户设备对服务质量(QoS)的不同需求,该文提出一种RIS辅助的多用户NOMA通信系统模型,并针对两类用户(信息用户和能量用户)的QoS需求设计了一种基于迭代优化的功率分配方法。该方法通过联合设计RIS相移矩阵、基站端波束赋形以及NOMA系统串行干扰消除顺序来最小化系统的总发射功率,以全面减轻通信系统中基站的能耗负担。仿真结果表明,与无RIS的场景相比,RIS辅助的NOMA系统可有效减小基站的能耗;在有RIS的场景下,所提功率分配方法的能耗明显低于RIS端随机选择相位的方式和基站端直接采用迫零波束赋形的方式。
可重构智能超表面(RIS)可被视为通信网络中具有特殊功能的“中继”来配合非正交多址接入(NOMA)系统构建一种协同的信息传输方案。考虑到未来物联网(IoT)场景下不同用户设备对服务质量(QoS)的不同需求,该文提出一种RIS辅助的多用户NOMA通信系统模型,并针对两类用户(信息用户和能量用户)的QoS需求设计了一种基于迭代优化的功率分配方法。该方法通过联合设计RIS相移矩阵、基站端波束赋形以及NOMA系统串行干扰消除顺序来最小化系统的总发射功率,以全面减轻通信系统中基站的能耗负担。仿真结果表明,与无RIS的场景相比,RIS辅助的NOMA系统可有效减小基站的能耗;在有RIS的场景下,所提功率分配方法的能耗明显低于RIS端随机选择相位的方式和基站端直接采用迫零波束赋形的方式。
2023, 45(10): 3612-3621.
doi: 10.11999/JEIT221232
摘要:
针对可重构智能表面(RIS)辅助的毫米波通信中信道状态信息难以获取问题,该文给RIS的部分器件配备射频链,以分开估计基站(BS)/用户(UE)到RIS之间的信道。根据该结构,提出一种低复杂度的信道估计算法。该算法首先采用解耦原子范数最小化(ANM)方法将信道的离开角和到达角的2维角度估计问题转化为两个1维的角度估计的半正定规划(SDP)问题;其次,利用交替方向乘子算法(ADMM)对该SDP问题进行求解,采用动量梯度下降法对信道矩阵参数进行更新以避免矩阵求逆运算,并通过对迭代步长和信道矩阵参数的联合优化以获得更加精准的信道估计值;最后利用信号的2维角度和信道矩阵参数得到路径增益估计。仿真结果表明,该算法达到了优良的信道估计性能,且在确保信道估计性能的系统参数设置下,该算法的复杂度较低。
针对可重构智能表面(RIS)辅助的毫米波通信中信道状态信息难以获取问题,该文给RIS的部分器件配备射频链,以分开估计基站(BS)/用户(UE)到RIS之间的信道。根据该结构,提出一种低复杂度的信道估计算法。该算法首先采用解耦原子范数最小化(ANM)方法将信道的离开角和到达角的2维角度估计问题转化为两个1维的角度估计的半正定规划(SDP)问题;其次,利用交替方向乘子算法(ADMM)对该SDP问题进行求解,采用动量梯度下降法对信道矩阵参数进行更新以避免矩阵求逆运算,并通过对迭代步长和信道矩阵参数的联合优化以获得更加精准的信道估计值;最后利用信号的2维角度和信道矩阵参数得到路径增益估计。仿真结果表明,该算法达到了优良的信道估计性能,且在确保信道估计性能的系统参数设置下,该算法的复杂度较低。
2023, 45(10): 3622-3630.
doi: 10.11999/JEIT221413
摘要:
近年来4元数理论成为各界学者研究的热点并被应用到许多领域。该文基于4元数自适应滤波算法对正交极化信道均衡问题进行研究。为了解决4元数恒模(QCMA)算法的相位模糊问题,该文将QCMA算法与4元数最小均方算法(QLMS)相结合提出一种4元数直接判决并行恒模(QCMA+DD-QLMS) 算法。基于广义哈密顿实演算(GHR)的梯度运算规则对新的算法做了理论推导并进行MATLAB实验仿真,仿真结果表明该文所提算法不但能够解决QCMA算法相位模糊问题,还具有更小的稳态均方误差(MSE)。
近年来4元数理论成为各界学者研究的热点并被应用到许多领域。该文基于4元数自适应滤波算法对正交极化信道均衡问题进行研究。为了解决4元数恒模(QCMA)算法的相位模糊问题,该文将QCMA算法与4元数最小均方算法(QLMS)相结合提出一种4元数直接判决并行恒模(QCMA+DD-QLMS) 算法。基于广义哈密顿实演算(GHR)的梯度运算规则对新的算法做了理论推导并进行MATLAB实验仿真,仿真结果表明该文所提算法不但能够解决QCMA算法相位模糊问题,还具有更小的稳态均方误差(MSE)。
2023, 45(10): 3631-3639.
doi: 10.11999/JEIT221102
摘要:
为提升基于非正交多址访问(NOMA)大规模雾接入网络的上行物理层安全(PLS),该文考虑了可重构智能表面(RIS)辅助无小区(CF)传输场景。基于功率域复用NOMA(PD-NOMA)并调用随机几何工具将空间效应引入所考虑网络的RIS模型设计,基于该方法来增强其PLS。该网络采用发射机-发射机对建模、Fisher-Snedecor\begin{document}$\mathcal{F}$\end{document} 模型表征复合信道,并重新设计了RIS反射模型。首先推导出所考虑网络组合信道增益的新统计特性,接着推导出RIS辅助PD-NOMA传输场景保密中断概率(SOP)的解析表达式。分析结果和仿真结果表明:该RIS设计能有效提高边缘用户信道质量,从而改变该网络NOMA用户对连续干扰消除(SIC)顺序;该RIS设计及排斥性雾节点(F-AP)部署均可增强该网络PLS,其中,基于β-Ginibre点过程(β-GPP)部署F-AP,在同等条件下,不需增加部署成本即可使SOP至多降低约2个数量级、使保密速率至多提升约\begin{document}$10.5\% $\end{document} 。
为提升基于非正交多址访问(NOMA)大规模雾接入网络的上行物理层安全(PLS),该文考虑了可重构智能表面(RIS)辅助无小区(CF)传输场景。基于功率域复用NOMA(PD-NOMA)并调用随机几何工具将空间效应引入所考虑网络的RIS模型设计,基于该方法来增强其PLS。该网络采用发射机-发射机对建模、Fisher-Snedecor
2023, 45(10): 3640-3647.
doi: 10.11999/JEIT221476
摘要:
信道估计是智能反射表面(IRS)辅助太赫兹(THz)通信中的一大挑战。为了减少由收发端天线和IRS反射元件数增加引起的信道估计导频开销过大的问题,该文提出一种基于正则平行因子(CP)分解的信道估计算法。首先在分析信道特点的基础上对IRS阵元进行分组设计,然后将IRS辅助的无线通信信道表示为统一数学表达式,接着利用多天线THz信道固有的低秩结构将信号接收矩阵构建成一个3维张量,并且利用基于正则平行因子分解算法对张量进行分解,最后利用相关性对信道参数进行估计。通过蒙特卡罗仿真表明,该算法在信道传输条件相同的情况下相对于基准算法有4.28 dB和7.12 dB左右的性能提升,并且具有更低的计算复杂度。
信道估计是智能反射表面(IRS)辅助太赫兹(THz)通信中的一大挑战。为了减少由收发端天线和IRS反射元件数增加引起的信道估计导频开销过大的问题,该文提出一种基于正则平行因子(CP)分解的信道估计算法。首先在分析信道特点的基础上对IRS阵元进行分组设计,然后将IRS辅助的无线通信信道表示为统一数学表达式,接着利用多天线THz信道固有的低秩结构将信号接收矩阵构建成一个3维张量,并且利用基于正则平行因子分解算法对张量进行分解,最后利用相关性对信道参数进行估计。通过蒙特卡罗仿真表明,该算法在信道传输条件相同的情况下相对于基准算法有4.28 dB和7.12 dB左右的性能提升,并且具有更低的计算复杂度。
2023, 45(10): 3648-3656.
doi: 10.11999/JEIT221398
摘要:
近年来,无人机(UAVs)凭借其机动灵活的特点,广泛应用于灾后救援工作。针对灾后应急通信网络下勘察无人机执行任务的场景,为了延长应急通信网络的整体续航时间,该文考虑了中继无人机的可用通信能量以及勘察无人机的最大飞行速度和实时通信质量,通过联合优化中继选择和飞行轨迹来实现系统的能量效率最大化。对于所涉及的非确定性多项式难度(NP-hard)优化问题,该文提出一种基于连续凸近似和禁忌搜索的交替迭代算法,将原问题拆成两个子问题交替求解,得到优化问题的近似最优解。仿真结果表明,该文所提算法具有较好的收敛性,可以有效提高系统的能量效率,相比于只优化中继和只优化轨迹的基准方案,能够提升31.1%和28.2%的性能。
近年来,无人机(UAVs)凭借其机动灵活的特点,广泛应用于灾后救援工作。针对灾后应急通信网络下勘察无人机执行任务的场景,为了延长应急通信网络的整体续航时间,该文考虑了中继无人机的可用通信能量以及勘察无人机的最大飞行速度和实时通信质量,通过联合优化中继选择和飞行轨迹来实现系统的能量效率最大化。对于所涉及的非确定性多项式难度(NP-hard)优化问题,该文提出一种基于连续凸近似和禁忌搜索的交替迭代算法,将原问题拆成两个子问题交替求解,得到优化问题的近似最优解。仿真结果表明,该文所提算法具有较好的收敛性,可以有效提高系统的能量效率,相比于只优化中继和只优化轨迹的基准方案,能够提升31.1%和28.2%的性能。
2023, 45(10): 3657-3666.
doi: 10.11999/JEIT221160
摘要:
基于信道状态信息(CSI)数据的WiFi指纹可用于室内定位。与信号强度值(RSSI)数据相比,CSI具有更高的数据信息粒度,并且可以在多个子载波上获得。当使用CSI数据进行室内定位时,相对于RSSI可以获得更好的结果。然而,无论使用RSSI还是CSI信号,在室内定位部署期间的一段时间后,室内环境通常会发生变化,并且基于测试数据的指纹数据库通常会恶化甚至失效。该文提出使用迁移学习算法来建立用于室内定位的指纹数据库。迁移学习的优势在于,可以使用较少的数据来获得更好的迁移训练结果。该文使用迁移学习来迁移指纹数据库的预测,延长指纹数据库的生命周期,并提高室内定位的鲁棒性。经过实验,1周后室内定位准确率保持在98%,两周后保持在97%。在相同成本下,该模型的生命周期和定位精度高于长短期记忆网络(LSTM)、卷积神经网络(CNN)、支持向量机(SVM)、深度神经网络(DNN)和其他定位系统。
基于信道状态信息(CSI)数据的WiFi指纹可用于室内定位。与信号强度值(RSSI)数据相比,CSI具有更高的数据信息粒度,并且可以在多个子载波上获得。当使用CSI数据进行室内定位时,相对于RSSI可以获得更好的结果。然而,无论使用RSSI还是CSI信号,在室内定位部署期间的一段时间后,室内环境通常会发生变化,并且基于测试数据的指纹数据库通常会恶化甚至失效。该文提出使用迁移学习算法来建立用于室内定位的指纹数据库。迁移学习的优势在于,可以使用较少的数据来获得更好的迁移训练结果。该文使用迁移学习来迁移指纹数据库的预测,延长指纹数据库的生命周期,并提高室内定位的鲁棒性。经过实验,1周后室内定位准确率保持在98%,两周后保持在97%。在相同成本下,该模型的生命周期和定位精度高于长短期记忆网络(LSTM)、卷积神经网络(CNN)、支持向量机(SVM)、深度神经网络(DNN)和其他定位系统。
2023, 45(10): 3667-3675.
doi: 10.11999/JEIT221412
摘要:
网络虚拟化允许多个虚拟网络在同一物理基础设施上共存,有利于未来网络技术的增量部署。然而,当前可编程数据平面提供独占的数据平面抽象难以同时支持多个网络功能,该文提出一种支持并行流水线的虚拟化可编程数据平面结构(Virtualized P4-based Programmable Data Plane architecture with Parallel Pipeline,VirtP6),允许在单个物理设备上运行多个相互隔离的网络功能。VirtP6改变了可编程数据平面的单一流水线结构,引入并行的多个数据包处理流水线,实现了可编程数据平面的虚拟化,并保证了不同虚拟网络功能之间的资源隔离、流量隔离和访问隔离。最后,针对VirtP6的虚拟化开销、隔离性、可扩展性、网络适用性能进行实验评估。实验结果显示,与HyperP4相比,VirtP6大大降低了虚拟化开销,将延迟减少了68%,吞吐量提高了75%,具有良好的隔离性和扩展性。
网络虚拟化允许多个虚拟网络在同一物理基础设施上共存,有利于未来网络技术的增量部署。然而,当前可编程数据平面提供独占的数据平面抽象难以同时支持多个网络功能,该文提出一种支持并行流水线的虚拟化可编程数据平面结构(Virtualized P4-based Programmable Data Plane architecture with Parallel Pipeline,VirtP6),允许在单个物理设备上运行多个相互隔离的网络功能。VirtP6改变了可编程数据平面的单一流水线结构,引入并行的多个数据包处理流水线,实现了可编程数据平面的虚拟化,并保证了不同虚拟网络功能之间的资源隔离、流量隔离和访问隔离。最后,针对VirtP6的虚拟化开销、隔离性、可扩展性、网络适用性能进行实验评估。实验结果显示,与HyperP4相比,VirtP6大大降低了虚拟化开销,将延迟减少了68%,吞吐量提高了75%,具有良好的隔离性和扩展性。
2023, 45(10): 3676-3684.
doi: 10.11999/JEIT221137
摘要:
为了更好地体现混沌系统的内在特征,该文提出一种基于小波包变换的自适应混沌信号降噪算法。首先,该算法根据不同分解尺度小波包系数的相关性不同,确定了最佳分解层数;以对数能量熵为代价函数,得到了最优小波包基。然后,在局部邻域内对近似系数进行投影分析,利用神经网络梯度下降法对细节系数进行自适应选择。通过最小化损失函数,最大限度降低噪声对混沌信号的影响。最后,通过对来自Rossler混沌模型的状态变量进行仿真分析,证实了该算法对混沌信号降噪的优越性。
为了更好地体现混沌系统的内在特征,该文提出一种基于小波包变换的自适应混沌信号降噪算法。首先,该算法根据不同分解尺度小波包系数的相关性不同,确定了最佳分解层数;以对数能量熵为代价函数,得到了最优小波包基。然后,在局部邻域内对近似系数进行投影分析,利用神经网络梯度下降法对细节系数进行自适应选择。通过最小化损失函数,最大限度降低噪声对混沌信号的影响。最后,通过对来自Rossler混沌模型的状态变量进行仿真分析,证实了该算法对混沌信号降噪的优越性。
2023, 45(10): 3685-3693.
doi: 10.11999/JEIT221165
摘要:
针对飞行自组网(FANET)中无人机(UAVs)快速移动造成的网络拓扑管理困难问题,考虑实际场景中无人机位置变化引起的可用信道差异,该文提出一种自适应蜂鸟算法对网络拓扑进行优化。首先,建立一个针对分簇结构的无人机拓扑模型,并且形成一个以最小化簇数量、负载偏差和簇移动度为目标的优化问题。其次,通过调节人工蜂鸟的觅食动作、加入扰动变异的方式,提出寻优能力更强的自适应蜂鸟算法(ADHA)。然后,设计合理的蜂鸟个体编码方式,将拓扑优化的决策过程转化为自适应蜂鸟算法的寻优过程。最后,通过仿真验证所提算法的收敛性,并与基于其他群智能优化算法的拓扑优化方法进行对比。实验结果表明,所提算法得到的拓扑优化策略不仅能够有效减少网络拓扑的簇数量,而且能够得到负载均衡、结构稳定的簇群。
针对飞行自组网(FANET)中无人机(UAVs)快速移动造成的网络拓扑管理困难问题,考虑实际场景中无人机位置变化引起的可用信道差异,该文提出一种自适应蜂鸟算法对网络拓扑进行优化。首先,建立一个针对分簇结构的无人机拓扑模型,并且形成一个以最小化簇数量、负载偏差和簇移动度为目标的优化问题。其次,通过调节人工蜂鸟的觅食动作、加入扰动变异的方式,提出寻优能力更强的自适应蜂鸟算法(ADHA)。然后,设计合理的蜂鸟个体编码方式,将拓扑优化的决策过程转化为自适应蜂鸟算法的寻优过程。最后,通过仿真验证所提算法的收敛性,并与基于其他群智能优化算法的拓扑优化方法进行对比。实验结果表明,所提算法得到的拓扑优化策略不仅能够有效减少网络拓扑的簇数量,而且能够得到负载均衡、结构稳定的簇群。
2023, 45(10): 3694-3701.
doi: 10.11999/JEIT221406
摘要:
针对弹性光网络(EONs)中时变业务生存性传输时消耗频谱资源多和业务阻塞率高的问题,该文提出一种基于频谱窗滑动的时变业务共享保护(TTSP-SWS)算法。TTSP-SWS算法选择可用频谱块承载权重和保护频谱块共享度的共享保护路径代价函数值最小的保护路径;通过在保护路径上滑动频谱窗,将时变业务分配至频谱窗共享度最高的频隙位置;当时变业务带宽变化时,采用基于频谱窗滑动的生存性扩展或压缩频谱分配策略调整时变业务的带宽分配。仿真结果表明,该文所提TTSP-SWS算法能降低网络的业务阻塞率和保护资源冗余度。
针对弹性光网络(EONs)中时变业务生存性传输时消耗频谱资源多和业务阻塞率高的问题,该文提出一种基于频谱窗滑动的时变业务共享保护(TTSP-SWS)算法。TTSP-SWS算法选择可用频谱块承载权重和保护频谱块共享度的共享保护路径代价函数值最小的保护路径;通过在保护路径上滑动频谱窗,将时变业务分配至频谱窗共享度最高的频隙位置;当时变业务带宽变化时,采用基于频谱窗滑动的生存性扩展或压缩频谱分配策略调整时变业务的带宽分配。仿真结果表明,该文所提TTSP-SWS算法能降低网络的业务阻塞率和保护资源冗余度。
2023, 45(10): 3702-3709.
doi: 10.11999/JEIT221223
摘要:
为克服联邦学习(FL)客户端数据和模型均需同构的局限性并且提高训练精度,该文提出一种基于合作博弈和知识蒸馏的个性化联邦学习(pFedCK)算法。在该算法中,每个客户端将在公共数据集上训练得到的局部软预测上传到中心服务器并根据余弦相似度从服务器下载最相近的k个软预测形成一个联盟,然后利用合作博弈中的夏普利值(SV)来衡量客户端之间多重协作的影响,量化所下载软预测对本地个性化学习效果的累计贡献值,以此确定联盟中每个客户端的最佳聚合系数,从而得到更优的聚合模型。最后采用知识蒸馏(KD)将聚合模型的知识迁移到本地模型,并在隐私数据集上进行本地训练。仿真结果表明,与其他算法相比,pFedCK算法可以将个性化精度提升约10%。
为克服联邦学习(FL)客户端数据和模型均需同构的局限性并且提高训练精度,该文提出一种基于合作博弈和知识蒸馏的个性化联邦学习(pFedCK)算法。在该算法中,每个客户端将在公共数据集上训练得到的局部软预测上传到中心服务器并根据余弦相似度从服务器下载最相近的k个软预测形成一个联盟,然后利用合作博弈中的夏普利值(SV)来衡量客户端之间多重协作的影响,量化所下载软预测对本地个性化学习效果的累计贡献值,以此确定联盟中每个客户端的最佳聚合系数,从而得到更优的聚合模型。最后采用知识蒸馏(KD)将聚合模型的知识迁移到本地模型,并在隐私数据集上进行本地训练。仿真结果表明,与其他算法相比,pFedCK算法可以将个性化精度提升约10%。
2023, 45(10): 3710-3718.
doi: 10.11999/JEIT220131
摘要:
由于实际网络的带宽是有限的,因此客户端和中心服务器之间的通信成为联邦学习的一个主要瓶颈。为了减小通信开销,该文引入事件触发机制,提出一个通信有效的联邦学习算法(FedET)。首先,客户端利用事件触发机制判断是否需要向中心服务器发送当前模型。然后,中心服务器基于收到的信息进行模型聚合。具体地,在每个通信轮次,客户端完成本地模型训练之后,将模型更新和触发阈值进行比较,若触发通信,则将信息进行压缩后发送给中心服务器。进一步地,分别对满足凸的、PL(Polyak-Łojasiewicz)条件的和非凸的光滑目标函数,该文分析了所提算法的收敛性并给出了证明。最后,在两个标准的数据集上进行仿真实验。实验结果验证了所提算法的可行性和有效性。
由于实际网络的带宽是有限的,因此客户端和中心服务器之间的通信成为联邦学习的一个主要瓶颈。为了减小通信开销,该文引入事件触发机制,提出一个通信有效的联邦学习算法(FedET)。首先,客户端利用事件触发机制判断是否需要向中心服务器发送当前模型。然后,中心服务器基于收到的信息进行模型聚合。具体地,在每个通信轮次,客户端完成本地模型训练之后,将模型更新和触发阈值进行比较,若触发通信,则将信息进行压缩后发送给中心服务器。进一步地,分别对满足凸的、PL(Polyak-Łojasiewicz)条件的和非凸的光滑目标函数,该文分析了所提算法的收敛性并给出了证明。最后,在两个标准的数据集上进行仿真实验。实验结果验证了所提算法的可行性和有效性。
2023, 45(10): 3719-3728.
doi: 10.11999/JEIT220959
摘要:
针对流量数据集中类别不平衡限制了分类模型对少数类攻击流量的检测性能这一问题,该文提出一种基于联合注意力机制和1维卷积神经网络-双向长短期记忆网络(1DCNN-BiLSTM)模型的流量异常检测方法。首先在数据预处理过程中利用BorderlineSMOTE方法对流量数据不平衡训练样本预处理,使得各类流量数据均衡,有助于后续模型对各类数据的充分训练。然后设计联合注意力机制和1DCNN-BiLSTM的模型对流量数据进行训练,提取流量数据的局部和长距离序列特征并进行分类,通过注意力机制将对分类有用的特征按其重要性赋予权值,提高对少数攻击类的检出率。实验结果表明,同几种现有方法相比,该文方法对NSL-KDD和CICIDS2017数据集的检测准确率最高(可达93.17%和98.65%),对NSL-KDD数据集中的提权攻击(U2R)攻击流量的检出率至少提升13.70%,证明了该文方法提升少数类攻击流量检出率的有效性。
针对流量数据集中类别不平衡限制了分类模型对少数类攻击流量的检测性能这一问题,该文提出一种基于联合注意力机制和1维卷积神经网络-双向长短期记忆网络(1DCNN-BiLSTM)模型的流量异常检测方法。首先在数据预处理过程中利用BorderlineSMOTE方法对流量数据不平衡训练样本预处理,使得各类流量数据均衡,有助于后续模型对各类数据的充分训练。然后设计联合注意力机制和1DCNN-BiLSTM的模型对流量数据进行训练,提取流量数据的局部和长距离序列特征并进行分类,通过注意力机制将对分类有用的特征按其重要性赋予权值,提高对少数攻击类的检出率。实验结果表明,同几种现有方法相比,该文方法对NSL-KDD和CICIDS2017数据集的检测准确率最高(可达93.17%和98.65%),对NSL-KDD数据集中的提权攻击(U2R)攻击流量的检出率至少提升13.70%,证明了该文方法提升少数类攻击流量检出率的有效性。
2023, 45(10): 3729-3736.
doi: 10.11999/JEIT221038
摘要:
大状态轻量级分组密码Gimli和Xoodoo具备逻辑门较少﹑低功耗和快速加密等诸多优点,备受业界关注。Gimli和Xoodoo算法均基于384 bit置换,大状态增加了对其安全性分析的困难性。该文通过引入AND、OR操作与S盒之间的等价表示,构建了Gimli和Xoodoo不可能差分区分器自动化搜索模型。进一步,为了验证不可能差分区分器的正确性,提出基于“二分法”的不可能差分区分器矛盾点检测新方法。结果表明:该文搜索并验证得到Gimli算法10轮不可能差分区分器以及Xoodoo算法4轮不可能差分区分器。特别地,Gimli算法不可能差分区分器轮数较已有结果提高了3轮。
大状态轻量级分组密码Gimli和Xoodoo具备逻辑门较少﹑低功耗和快速加密等诸多优点,备受业界关注。Gimli和Xoodoo算法均基于384 bit置换,大状态增加了对其安全性分析的困难性。该文通过引入AND、OR操作与S盒之间的等价表示,构建了Gimli和Xoodoo不可能差分区分器自动化搜索模型。进一步,为了验证不可能差分区分器的正确性,提出基于“二分法”的不可能差分区分器矛盾点检测新方法。结果表明:该文搜索并验证得到Gimli算法10轮不可能差分区分器以及Xoodoo算法4轮不可能差分区分器。特别地,Gimli算法不可能差分区分器轮数较已有结果提高了3轮。
2023, 45(10): 3737-3744.
doi: 10.11999/JEIT221282
摘要:
LEA算法是面向软件的轻量级加密算法,在2019年成为 ISO/IEC 国际标准轻量级加密算法,具有快速加密、占用运算资源少等优点。该文基于多条输入输出差分相同的路径计算了差分概率,首次对LEA-128进行了13轮和14轮的密钥恢复攻击;采用提前抛弃技术,分别在12轮和13轮差分特征后面添加了1轮,恢复了96 bit密钥;其中13轮的密钥恢复攻击数据复杂度为298个明文,时间复杂度为286.7次13轮LEA-128解密;14轮的密钥恢复攻击数据复杂度为2118个明文,时间复杂度为2110.6次14轮LEA-128解密。
LEA算法是面向软件的轻量级加密算法,在2019年成为 ISO/IEC 国际标准轻量级加密算法,具有快速加密、占用运算资源少等优点。该文基于多条输入输出差分相同的路径计算了差分概率,首次对LEA-128进行了13轮和14轮的密钥恢复攻击;采用提前抛弃技术,分别在12轮和13轮差分特征后面添加了1轮,恢复了96 bit密钥;其中13轮的密钥恢复攻击数据复杂度为298个明文,时间复杂度为286.7次13轮LEA-128解密;14轮的密钥恢复攻击数据复杂度为2118个明文,时间复杂度为2110.6次14轮LEA-128解密。
2023, 45(10): 3745-3751.
doi: 10.11999/JEIT221003
摘要:
目前通过深度学习对轻量级分组密码进行安全性分析正成为一个全新的研究热点。Gohr在2019年的美密会上首次将深度学习应用于分组密码安全性分析(doi:10.1007/978-3-030-26951-7_6 ),利用卷积神经网络学习固定输入差分的密文差分分布特征,从而构造出高精度的神经网络区分器。LBlock算法是一种具有优良软硬件实现效率的轻量级分组密码算法,自算法发表以来受到了研究者的广泛关注。该文基于残差网络,构造了减轮LBlock差分神经网络区分器,所得7轮和8轮区分器模型的精度分别是0.999和0.946。进一步利用构造的9轮区分器,提出了针对11轮LBlock的密钥恢复攻击方案。实验结果表明,当密码算法迭代轮数较少时,该方案进行攻击时无需单独考虑S盒,相比于传统攻击方案具有方案流程简单和易于实现等特点,并且在数据复杂度和时间复杂度方面具有较大的优越性。
目前通过深度学习对轻量级分组密码进行安全性分析正成为一个全新的研究热点。Gohr在2019年的美密会上首次将深度学习应用于分组密码安全性分析(doi:
2023, 45(10): 3752-3758.
doi: 10.11999/JEIT221212
摘要:
网络编码允许中间节点对数据包先编码再转发,提高了系统的鲁棒性并节约网络资源。实际应用中网络编码容易受到污染攻击,鉴于此,该文提出网络编码环境下无双线性对的无证书签密(NC-CLPFSC)。NC-CLPFSC通过同态哈希函数防御污染攻击,而且还避免了密钥托管和证书管理,同时降低了计算和通信成本。
网络编码允许中间节点对数据包先编码再转发,提高了系统的鲁棒性并节约网络资源。实际应用中网络编码容易受到污染攻击,鉴于此,该文提出网络编码环境下无双线性对的无证书签密(NC-CLPFSC)。NC-CLPFSC通过同态哈希函数防御污染攻击,而且还避免了密钥托管和证书管理,同时降低了计算和通信成本。
2023, 45(10): 3759-3766.
doi: 10.11999/JEIT210717
摘要:
针对传统云端数据完整性验证方案中存在过度依赖完全可信第三方审计者(TPA)、复杂的密钥管理和不支持数据访问者授权等问题,该文提出一种基于区块链和雾计算的去中心化数据完整性审计方案。为了实现审计方案的去中心化,使用雾节点和智能合约代替第三方审计者。利用区块链设计智能合约保障方案中各个实体的公平交易;将审计过程生成的证据存储在区块链中以防止各个实体的不诚实行为。引入无证书密码体制,解决了传统审计方案中复杂的密钥托管和证书管理问题。此外,通过加密累加器实现访问用户授权和身份认证。分析结果表明,该方案满足签名的不可伪造性,与同类方案相比具有较高的计算性能。
针对传统云端数据完整性验证方案中存在过度依赖完全可信第三方审计者(TPA)、复杂的密钥管理和不支持数据访问者授权等问题,该文提出一种基于区块链和雾计算的去中心化数据完整性审计方案。为了实现审计方案的去中心化,使用雾节点和智能合约代替第三方审计者。利用区块链设计智能合约保障方案中各个实体的公平交易;将审计过程生成的证据存储在区块链中以防止各个实体的不诚实行为。引入无证书密码体制,解决了传统审计方案中复杂的密钥托管和证书管理问题。此外,通过加密累加器实现访问用户授权和身份认证。分析结果表明,该方案满足签名的不可伪造性,与同类方案相比具有较高的计算性能。
2023, 45(10): 3767-3775.
doi: 10.11999/JEIT221341
摘要:
SAR遥感影像中的几何结构信息对于目标识别和判读具有十分重要的意义。现有SAR遥感影像的正射校正方法沿用光学正射影像(DOM)的校正思路,直接利用物方-像方采样进行,SAR遥感影像叠掩现象所引起的几何畸变会对目标结构信息提取造成干扰。针对以上问题,该文提出一种面向目标结构信息保持的SAR真正射影像(TDOM)制作方法,基于高精度数字表面模型(DSM),通过像方-物方反投影提取像方影像中的叠掩区域;然后,针对叠掩区域进行多高程面投影拟合分析,将雷达波与物方高程最高处的交点作为真实物方投影点,生成单视向SAR真正射影像;最后,利用不同视向的SAR真正射影像进行缺失信息补偿,得到融合后的多视向SAR真正射影像。以高分三号SAR影像作为研究对象,实验结果表明,相比于传统SAR正射影像,该文所提方法能够更好地保持目标结构信息,有效提升处理后SAR影像的目标识别和判读能力。
SAR遥感影像中的几何结构信息对于目标识别和判读具有十分重要的意义。现有SAR遥感影像的正射校正方法沿用光学正射影像(DOM)的校正思路,直接利用物方-像方采样进行,SAR遥感影像叠掩现象所引起的几何畸变会对目标结构信息提取造成干扰。针对以上问题,该文提出一种面向目标结构信息保持的SAR真正射影像(TDOM)制作方法,基于高精度数字表面模型(DSM),通过像方-物方反投影提取像方影像中的叠掩区域;然后,针对叠掩区域进行多高程面投影拟合分析,将雷达波与物方高程最高处的交点作为真实物方投影点,生成单视向SAR真正射影像;最后,利用不同视向的SAR真正射影像进行缺失信息补偿,得到融合后的多视向SAR真正射影像。以高分三号SAR影像作为研究对象,实验结果表明,相比于传统SAR正射影像,该文所提方法能够更好地保持目标结构信息,有效提升处理后SAR影像的目标识别和判读能力。
2023, 45(10): 3776-3785.
doi: 10.11999/JEIT221072
摘要:
探地雷达(GPR)是一种基于电磁波的地下无损探测技术,广泛应用于市政工程、交通、军事等领域。在数据采集过程中,由于发射天线和接收天线之间的耦合、起伏地面的散射以及地下随机媒质的复杂性等原因,采集得到的GPR B-scan回波中通常存在杂波,杂波严重影响了地下目标的检测和特征提取。该文提出一种用于GPR B-scan图像杂波抑制的解纠缠表示生成对抗网络(DR-GAN),设计了目标特征编码器和杂波特征编码器用来提取GPR B-scan图像中的目标特征和杂波特征,设计了杂波抑制生成器用来获取杂波抑制后的GPR B-scan图像。与现有的基于监督学习的GPR杂波抑制方法相比,该方法在网络训练时不需要成对的匹配数据,可以更好地应用于实测GPR图像的杂波抑制。在仿真和实测GPR数据上的实验结果表明,DR-GAN这一无监督学习网络具有更好的杂波抑制性能。对石英砂中埋设的钢筋进行数据采集,运用DR-GAN对含杂波的实测数据进行处理,处理结果的改善系数(IF)指标较现有的鲁棒非负矩阵分解(RNMF)方法提高了17.85 dB。
探地雷达(GPR)是一种基于电磁波的地下无损探测技术,广泛应用于市政工程、交通、军事等领域。在数据采集过程中,由于发射天线和接收天线之间的耦合、起伏地面的散射以及地下随机媒质的复杂性等原因,采集得到的GPR B-scan回波中通常存在杂波,杂波严重影响了地下目标的检测和特征提取。该文提出一种用于GPR B-scan图像杂波抑制的解纠缠表示生成对抗网络(DR-GAN),设计了目标特征编码器和杂波特征编码器用来提取GPR B-scan图像中的目标特征和杂波特征,设计了杂波抑制生成器用来获取杂波抑制后的GPR B-scan图像。与现有的基于监督学习的GPR杂波抑制方法相比,该方法在网络训练时不需要成对的匹配数据,可以更好地应用于实测GPR图像的杂波抑制。在仿真和实测GPR数据上的实验结果表明,DR-GAN这一无监督学习网络具有更好的杂波抑制性能。对石英砂中埋设的钢筋进行数据采集,运用DR-GAN对含杂波的实测数据进行处理,处理结果的改善系数(IF)指标较现有的鲁棒非负矩阵分解(RNMF)方法提高了17.85 dB。
2023, 45(10): 3786-3795.
doi: 10.11999/JEIT220997
摘要:
针对复杂环境下的非星凸形不规则形状扩展目标跟踪问题,该文提出基于能量泛函的水平集高斯过程扩展目标跟踪算法。首先,利用水平集随机超曲面模型(Level-Set RHM)通过多边形方法对形状内部进行建模。然后,用高斯过程(GP)学习Level-Set建模输入与输出的非线性映射关系,以求得边界函数最大值,并进一步推导Level-Set与GP相融合的非线性量测方程。在最优非线性滤波的框架下,最终推导得到水平集高斯过程(Level-Set GP)算法,并利用面积差作为不规则形状扩展目标形状估计的评价指标。仿真实验表明了所提算法对非星凸形不规则形状扩展目标形状估计的有效性。
针对复杂环境下的非星凸形不规则形状扩展目标跟踪问题,该文提出基于能量泛函的水平集高斯过程扩展目标跟踪算法。首先,利用水平集随机超曲面模型(Level-Set RHM)通过多边形方法对形状内部进行建模。然后,用高斯过程(GP)学习Level-Set建模输入与输出的非线性映射关系,以求得边界函数最大值,并进一步推导Level-Set与GP相融合的非线性量测方程。在最优非线性滤波的框架下,最终推导得到水平集高斯过程(Level-Set GP)算法,并利用面积差作为不规则形状扩展目标形状估计的评价指标。仿真实验表明了所提算法对非星凸形不规则形状扩展目标形状估计的有效性。
2023, 45(10): 3796-3804.
doi: 10.11999/JEIT221265
摘要:
相比于空中的电磁波信号,水下的声波信号传播速度小、频率低,多普勒效应和窄带信号处理方法严重影响多无人水下航行器(multi-UUV)协同探测声呐对运动目标的探测性能。该文基于Costas序列和正交频分线性调频(OFD-LFM)波形,设计了离散频率编码非正交线性调频波形(DFCW-NOFD-LFM),并将该波形与二进制相移键控(BPSK)、离散频率编码波形(DFCW)等传统码分多址(CDMA)波形进行了性能比较。结果表明,所设计波形具有大多普勒容限、良好的自相关与互相关性能和优秀的抗混响能力,有望应用于多UUV协同探测声呐,以提高其运动目标探测性能。
相比于空中的电磁波信号,水下的声波信号传播速度小、频率低,多普勒效应和窄带信号处理方法严重影响多无人水下航行器(multi-UUV)协同探测声呐对运动目标的探测性能。该文基于Costas序列和正交频分线性调频(OFD-LFM)波形,设计了离散频率编码非正交线性调频波形(DFCW-NOFD-LFM),并将该波形与二进制相移键控(BPSK)、离散频率编码波形(DFCW)等传统码分多址(CDMA)波形进行了性能比较。结果表明,所设计波形具有大多普勒容限、良好的自相关与互相关性能和优秀的抗混响能力,有望应用于多UUV协同探测声呐,以提高其运动目标探测性能。
2023, 45(10): 3805-3811.
doi: 10.11999/JEIT221061
摘要:
针对真实信源位置与字典网格不匹配导致波达角估计(DOA)误差过大的问题,该文提出一种基于修正迭代自适应(IAA)功率谱算法的离网格(Off-Grid)DOA估计方法(OGIAA)。该方法首先通过修正IAA方法得到信号功率谱,读出功率峰值的对应网格角度作为粗估计结果,再利用平方误差代价函数,将代价函数2阶泰勒展开并最小化得到初始偏移量,最后交替优化功率分量和偏移量,实现高精度的离网格DOA估计。理论分析和仿真结果表明,该方法实现过程简单,无正则化参数影响,能准确估计出偏移网格的信源角度,在高阵列自由度的非均匀阵列上也同样具备高估计精度。
针对真实信源位置与字典网格不匹配导致波达角估计(DOA)误差过大的问题,该文提出一种基于修正迭代自适应(IAA)功率谱算法的离网格(Off-Grid)DOA估计方法(OGIAA)。该方法首先通过修正IAA方法得到信号功率谱,读出功率峰值的对应网格角度作为粗估计结果,再利用平方误差代价函数,将代价函数2阶泰勒展开并最小化得到初始偏移量,最后交替优化功率分量和偏移量,实现高精度的离网格DOA估计。理论分析和仿真结果表明,该方法实现过程简单,无正则化参数影响,能准确估计出偏移网格的信源角度,在高阵列自由度的非均匀阵列上也同样具备高估计精度。
2023, 45(10): 3812-3820.
doi: 10.11999/JEIT221435
摘要:
当前研究设计的超表面吸波器(MSA)具有良好的电磁(EM)波吸收特性,然而很少考虑入射电磁波形式和功率的影响。该文提出一种在相同频率下可以选择性吸收特定脉冲波的非线性电路MSA。设计的MSA单元结构由集成二极管与电阻电容并联的非线性电路的金属方环形谐振器,中间介质基板隔离层和底部接地层组成。结果显示该MSA对50 ns的短脉冲波在3.2 GHz吸收率可达97%,而对应同频率下的连续波吸收率只有21%。在3.2 GHz附近,该MSA对50 ns短脉冲波吸收率随着功率不同而动态调节且总保持在60%以上,而对应的连续波吸收率只固定在20%左右。当增大脉冲宽度时,设计的MSA吸收率先增大后显著减小。功率为0 dBm和–4 dBm的脉冲波TE模和TM模斜入射情况下,设计的MSA吸收率仍然超过60%。进一步的研究结果表明该MSA对短脉冲波吸收特性严重依赖于非线性电路电容以及单元结构几何参数设计。该研究在无线通信、抗电磁干扰、电磁兼容等领域具有潜在的应用前景。
当前研究设计的超表面吸波器(MSA)具有良好的电磁(EM)波吸收特性,然而很少考虑入射电磁波形式和功率的影响。该文提出一种在相同频率下可以选择性吸收特定脉冲波的非线性电路MSA。设计的MSA单元结构由集成二极管与电阻电容并联的非线性电路的金属方环形谐振器,中间介质基板隔离层和底部接地层组成。结果显示该MSA对50 ns的短脉冲波在3.2 GHz吸收率可达97%,而对应同频率下的连续波吸收率只有21%。在3.2 GHz附近,该MSA对50 ns短脉冲波吸收率随着功率不同而动态调节且总保持在60%以上,而对应的连续波吸收率只固定在20%左右。当增大脉冲宽度时,设计的MSA吸收率先增大后显著减小。功率为0 dBm和–4 dBm的脉冲波TE模和TM模斜入射情况下,设计的MSA吸收率仍然超过60%。进一步的研究结果表明该MSA对短脉冲波吸收特性严重依赖于非线性电路电容以及单元结构几何参数设计。该研究在无线通信、抗电磁干扰、电磁兼容等领域具有潜在的应用前景。