Loading [MathJax]/jax/element/mml/optable/GeneralPunctuation.js
高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于双重YOLOv8-pose模型的探地雷达双曲线关键点检测与目标定位

侯斐斐 彭应昊 董健 银雪

温郑铨, 杜培明, 郭春生. 规范化分段线性化网络的可控开关模型[J]. 电子与信息学报, 1998, 20(1): 125-131.
引用本文: 侯斐斐, 彭应昊, 董健, 银雪. 基于双重YOLOv8-pose模型的探地雷达双曲线关键点检测与目标定位[J]. 电子与信息学报, 2024, 46(11): 4305-4316. doi: 10.11999/JEIT240242
Wen Zhengquan, Du Peiming, Guo Chunsheng. THE CONTROLLED-SWITCH MODELS FOR CANONICAL PIECEWISE-LINEAR NETWORK[J]. Journal of Electronics & Information Technology, 1998, 20(1): 125-131.
Citation: HOU Feifei, PENG Yinghao, DONG Jian, YIN Xue. Ground Penetrating Radar Hyperbolic Keypoint Detection and Object Localization Based on Dual YOLOv8-pose Model[J]. Journal of Electronics & Information Technology, 2024, 46(11): 4305-4316. doi: 10.11999/JEIT240242

基于双重YOLOv8-pose模型的探地雷达双曲线关键点检测与目标定位

doi: 10.11999/JEIT240242
基金项目: 国家自然科学基金(62406346),湖南省自然科学基金(2022JJ30052),长沙市自然科学基金(kq2208285)
详细信息
    作者简介:

    侯斐斐:女,讲师,研究方向为探地雷达图像解译、无损探测、深度学习、目标识别

    彭应昊:男,本科生,研究方向为图像识别与深度学习

    董健:男,教授,研究方向为天线、雷达信号处理、机器学习算法及其电磁应用

    银雪:女,本科生,研究方向为计算机视觉与目标识别

    通讯作者:

    董健 dongjian@csu.edu.cn

  • 中图分类号: TN957.51; TP391

Ground Penetrating Radar Hyperbolic Keypoint Detection and Object Localization Based on Dual YOLOv8-pose Model

Funds: The National Natural Science Foundation of China (62406346), Hunan Provincial Natural Science Foundation (2022J30052), Changsha Natural Science Foundation (kq2208285)
  • 摘要: 探地雷达(GPR)是一种可用于地下目标识别的无损检测方法。针对现有方法存在不同尺度目标兼容性差、复杂图像识别难度大、无法精确定位等问题,该文提出一种基于双重YOLO姿态模型(YOLOv8-pose)的GPR双曲线关键点检测与目标定位,命名为双重YOLO关键点定位方法(DYKL),用于地下目标的检测与精确定位。所提模型架构包含两个阶段:首先,第1阶段是基于YOLOv8-pose模型的GPR目标检测,以确定候选目标的位置;接着,第1阶段的部分训练权重被共享并传递到第2阶段,后者以此为基础继续训练YOLOv8-pose网络,用于候选目标特征的关键点检测及获取,从而实现地下目标的自动化定位。通过与级联区域卷积网络(Cascade R-CNN)、 更快的区域卷积网络(Faster R-CNN)、 实时对象检测模型(RTMDet)以及“你只看一次”人脸模型(YOLOv7-face)4种先进的深度模型进行比较,所提模型平均识别准确率达到98.8%,性能优于其他模型。结果表明所提DYKL模型具有较高的识别准确性与较强的鲁棒性,可以为地下目标的精确定位提供参考。
  • 新一代网络中大量新型业务涌现,对网络的时延服务质量(Quality of Service, QoS)保障提出了较高的要求[1]。无线时延QoS保障需要以牺牲带宽为代价,在无线频谱资源短缺的现状下,时延QoS保障越来越困难。为缓解无线频谱资源短缺与通信业务量增长及时延QoS保障之间的矛盾,下一代网络亟需拓展新型频谱资源。近年来,占用400~800 THz免授权频段的可见光通信(Visible Light Communication, VLC)以其超高的传输速率有望为下一代网络提供更严格的时延QoS保障,成为国内外学术界、工业界关注的热点[2]

    相较于电磁波,可见光的直射性较强,且相比于射频信道,VLC信道并非各向同性[3]。因此,VLC易受终端晃动的影响。在实际VLC系统中,智能终端在接收VLC信号的过程中,并非始终保持垂直向上,智能终端的方向常因用户姿势的变化而发生改变,即发生终端晃动。在现有VLC的研究中,大多未考虑终端晃动对VLC传输的影响。然而,事实上,终端晃动将导致VLC接收平面方向的变化,进而对接收端入射角、VLC信道增益与传输速率产生较大的影响。

    2016年,文献[4]提出可以基于航向角、俯仰角和横滚角描述终端在3自由度的随机晃动,并首次分析了终端随机晃动对吞吐量和网络负载均衡的影响。文献[5]研究了终端晃动对VLC视距链路(Line of Sight, LoS)信道增益的影响,并提出了信道增益的统计分布模型。文献[6]探索了终端晃动角度对VLC信道容量的影响,从信息论的角度推导了VLC容量上、下界,并以VLC容量下界最大化为目标求解了终端的最佳晃动角度。同年,文献[7]以开关键控调制下独立噪声VLC系统的误码率(Bit Error Ratio, BER)最小化为目标求解了终端的最佳晃动角度。尽管文献[2-7]从不同角度分析、优化了终端晃动对VLC系统性能的影响,但上述研究中对终端晃动的随机性均存在假设,并未从实际出发建模终端的随机晃动过程。2019年,文献[8]采用智能终端配备的陀螺仪、加速器和指南针,对40个测试者在静止场景和匀速固定路径移动场景中使用VLC终端的晃动过程进行采样,并通过对实测数据的拟合分析,提出了VLC系统统计晃动模型。研究结果表明,静止用户和移动用户的晃动方位角均服从均匀分布,且其晃动极化角分别服从截断式拉普拉斯分布与截断式高斯分布。在该结论的基础上,文献[9]分析了终端随机晃动对VLC系统BER和SNR的影响。文献[10]分析了终端随机晃动对VLC系统物理层安全容量和安全中断概率的影响。进一步地,2021年,文献[11]综合用户的随机空间分布与随机晃动,提出VLC信道增益的统计模型,并分析了VLC系统的BER性能。目前为止,现有研究均未考虑终端晃动对VLC系统时延QoS的影响。

    近年来,考虑到无线信道的随机性使得传统确定性时延QoS分析方法难以适用,以大偏差理论为基础的有效容量理论逐渐成为建模分析无线通信统计时延QoS的主要方法[12]。有效容量的物理含义是指对于某一给定的服务过程,在满足排队时延要求的前提下,系统可支持的最大到达速率[13]。在VLC系统中,信道遮挡、用户移动、终端晃动等因素也使得VLC信道具有较强的随机性,因此,部分学者考虑基于有效容量分析VLC系统的时延QoS,研究VLC系统中统计时延QoS约束下可达传输速率。文献[14]和文献[15]将有效容量理论应用于VLC和射频异构网络,分析因VLC信道遮挡导致的服务过程随机性对统计时延QoS的影响,并分别提出异构网络终端资源分配与链路选择算法。在此基础上,文献[16]针对统计时延QoS约束下以用户为中心的VLC组网问题展开研究。此外,针对上行多用户VLC网络,文献[17]综合随机接入与信道遮挡建模VLC系统的随机服务过程,提出支持终端统计时延QoS保障的接入算法。文献[18]研究了私密VLC场景下,终端的差异化统计时延QoS保障问题。现有VLC系统时延QoS方面研究均假设终端方向始终为垂直向上,未考虑终端晃动对VLC系统时延QoS分析与保障的影响。

    在实际VLC系统中,终端的随机晃动将对VLC信道增益与传输速率产生影响,从而使VLC系统的服务过程具有时间相关性。现有研究均未从时间相关性的角度出发对VLC终端随机晃动进行建模,也未分析随机晃动对终端统计时延QoS的影响。鉴于此,本文在考虑终端随机晃动的影响因素下,基于有效容量理论,研究具有统计时延QoS约束的VLC终端的传输速率。具体贡献如下:

    (1) 本文基于3维离散时间马尔可夫链为VLC终端构建了3自由度随机晃动模型,利用晃动过程中航向角、俯仰角、横滚角的变化,从时间相关性的角度刻画了VLC终端的随机晃动过程。

    (2) 基于有效容量理论,本文提出了支持终端晃动的多光源VLC系统有效容量,用于表征终端随机晃动的影响因素下,具有统计时延QoS约束的VLC终端的传输速率。

    (3) 仿真结果说明了终端晃动对多光源VLC系统容量的影响,验证了本文所推导有效容量的准确性,并分析了不同晃动模型参数、不同系统参数对晃动终端有效容量的影响。

    在如图1所示的室内下行多光源VLC系统中,共有NU个终端(User Equipment, UE),NA个接入点(Access Point, AP)。AP与UE间采用矢量传输方式[16]。UE接收到的信号包含来自LoS链路的直射光信号与来自非视距链路(None Line of Sight, NLoS)的反射光信号。由于LoS链路是VLC的主要组成部分,LoS链路比NLoS链路中最强的部分还高出7 dB[19]。因此,本文只考虑LoS链路。

    图 1  室内下行VLC系统

    根据文献[19],第i个AP与第j个终端之间的LoS链路增益可表示为

    h(i,j)=η(La+1)AϖT2πd2(i,j)g(ψin(i,j))cosLa(ψir(i,j))cos(ψin(i,j)) (1)

    其中,d(i,j)表示从APi到UEj的直线距离,A表示光电检测器(PhotoDiodes, PD)的物理面积,η, ϖ, T分别表示发送端发光二极管(Light Emitting Diode, LED)的电光转换效率、接收端PD的响应、互阻抗放大器增益。La为朗伯系数且La=ln2/ln(cosϕ1/2),其中ϕ1/2为LED的半功率角。ψin(i,j)ψir(i,j)分别表示从APi到UEj的LoS链路的入射角与反射角,如图1所示。函数g(·)表示光集中器增益函数,其表达式为

    g(ψin(i,j))={a2sin2ψc,ψin(i,j)ψc0,ψin(i,j)>ψc (2)

    其中,a表示折射系数,ψc表示接收端视场角(Field of View, FoV)的1/2。

    VLC噪声包含接收端电路中的热噪声与无线光传输环境中的散粒噪声[19],VLC噪声的方差σ2可以表示为

    σ2=σ2sh+σ2th (3)

    散粒噪声的方差σ2sh

    σ2sh=2qτPrBe+2qIbgI1Be (4)

    其中,q为电子电荷,Be为等效噪声带宽,Ibg为由背景光产生的背景电流,I1为噪声带宽系数,τ为PD的响应率,Pr为接收功率。

    热噪声的方差σ2th

    σ2th=8πrTkGωδI1B2e+16π2rTkΓgmη2δ2I2B3e (5)

    其中,r为玻尔兹曼常数,Tk为绝对温度,G为开环电压增益,ω为PD单位面积的固定电容,δ为光探测器的物理面积,Γ为FET信道噪声因子,gm为FET跨导,I2为噪声带宽系数。

    在实际室内VLC场景中,用户持有的终端设备会随着用户使用姿态的不同而随机晃动,终端的接收平面法向量并非始终垂直向上。考虑到目前大多数智能终端均配备有陀螺仪、加速器和指南针,当终端随机晃动时,其可在3个自由度上测量终端的晃动情况。为建模终端的随机晃动,本文以终端的接收点为原点建立3维笛卡儿坐标系,分别通过航向角α、俯仰角β和横滚角γ描述终端在3自由度的随机晃动,如图2所示。具体来说,航向角α描述了终端围绕Z轴的旋转,α取值范围是0°到360°;俯仰角β描述了终端围绕X轴的旋转,取值范围是–180°~180°;横滚角γ描述了终端围绕Y轴的旋转,取值范围是–90°到90°。

    图 2  3自由度终端晃动示意图

    进一步地,为刻画终端晃动对VLC链路的影响,本文令终端晃动前后的接收平面法向量分别为nn,并定义n=[0,0,1]T,则

    n=[sinαsinβcosγ+cosαsinγsinαsinγcosαsinβcosγ cosβcosγ] (6)

    其中,[·]T表示矩阵转置。

    为描述统计时延QoS约束对VLC的影响,本文采用有效容量刻画终端晃动场景下VLC的传输速率。在基于排队论建模的VLC系统中,终端j的缓存被视为一个具有随机到达过程的队列,该队列的服务过程即为VLC系统的传输过程。终端j的统计时延QoS要求由时延界(最大容忍时延)和时延界违反概率共同刻画,即

    Pr{DjDmaxj}eθjμjDmaxj (7)

    其中,DjDmaxj分别为终端j的稳态时延和时延界,θj为终端j的QoS指数,μj为恒定速率,其值取决于排队系统的到达过程和服务过程。

    本文采用统计时延QoS指数θj刻画终端j的统计时延QoS要求。对于给定的时延界Dmaxj,较大的统计时延QoS指数θj对应的队列溢出概率衰减较快,表示终端j的时延QoS要求较为严格;较小的统计时延QoS指数θj对应的队列溢出概率衰减较慢,表示终端j的时延QoS要求较为松弛。

    根据文献[13],终端j的有效容量定义为:在θj所表征的统计时延QoS约束下,VLC系统可支持的最大恒定到达速率。令c(t)表示时间t的瞬时服务速率,基于对随机服务过程渐进矩生成函数的推导,将终端j的有效容量表示为

    CE(θj)=limt1θjtlog2[E(eθjS(0,t))] (8)

    其中,E()表示求期望,S(0,t)表示0到t时刻的累积服务,与瞬时服务速率的关系为S(0,t)=t0c(τ) dτ

    在室内VLC系统中,终端的晃动常由用户的姿势变化引起,具有随机性。考虑到用户动作的连续性,晃动前后的终端接收平面方向的变化往往具有相关性,换言之,晃动终端在某时刻的接收平面方向与上一时刻的方向有关,而与之前时刻的方向无关。因此,终端的晃动过程可视为具有突发性、时间相关性的随机过程。

    鉴于马尔可夫过程具有无记忆性,本文基于3维离散时间马尔可夫链构建终端晃动模型。为刻画终端的3自由度随机晃动,本文以终端的晃动角度(α,β,γ)定义马尔可夫链的状态,并假设在两次连续对终端晃动状态的观测采样中,终端只能在航向角α、俯仰角β、横滚角γ的任意一个角度发生变化,进而跳转至下一个状态。本文假设终端的晃动角度变化步长分别为Δα,Δβ,Δγ。基于3维离散时间马尔可夫链的终端晃动模型状态转移情况如图3所示,其中P00Pkl,k=1,2,3,l=1,2分别表示马尔可夫链的状态逗留概率与转移概率。根据马尔可夫链的性质,可得

    图 3  3维离散时间马尔可夫链的状态转移情况
    P00+3k=12l=1Pkl=1 (9)

    假设3维离散时间马尔可夫链共有Nα×Nβ×Nγ个状态,其中Nα, Nβ, Nγ可根据终端晃动角度的变化步长及终端晃动在3自由度的变化范围计算而得,进而可得到3维离散时间马尔可夫链的状态空间如图4所示。在图4中,各圆点表示终端所处的晃动状态,对应唯一一组角度值,箭头表示状态之间的跳转关系。为方便描述,在图4中,本文为各马尔可夫状态进行标号,例如:将α=0°, β=–180°, γ=–90°对应的马尔可夫状态标记为(1, 1, 1),将α=0°, β=180°, γ=–90°对应的马尔可夫状态标记为(1, Nβ, 1),将α=360°, β=180°, γ=90°对应的马尔可夫状态标记为(Nα, Nβ, Nγ),以此类推。

    图 4  3维离散时间马尔可夫链的状态空间

    本文所提出的3维离散时间马尔可夫链终端晃动模型可用于建模终端任意的晃动行为,马尔可夫链的状态转移概率矩阵Q由终端的晃动特性决定。假设在两次连续对终端晃动的观测采样中,处于同一状态的概率为P00,若不处于同一状态,则终端可以以相同的概率选择航向角α、俯仰角β、横滚角γ中的任意一个自由度进行晃动,即跳转到相邻的另一状态,如图3所示。根据3维离散马尔可夫链中晃动状态的跳转规律与3个晃动角度的取值范围,可以将图4中的晃动状态分为4类:(1) 在终端晃动的3个自由度中,3个角度的取值均在取值范围内且不为最值,此时晃动状态的转移有7种情况,如图3所示,除逗留在同一状态的概率P00外,向其它6种状态转移的概率相等,即(1P00)/6;(2) 在终端晃动的3个自由度中,仅存在一个角度的取值为最值,例如α=360°或0°时,终端在该自由度的晃动角度不能继续增大或减小,故此时晃动状态的转移仅有6种情况,除逗留在同一状态的概率P00外,向其它5种状态转移的概率相等,即(1P00)/5;(3) 在终端晃动的3个自由度中,仅存在两个角度的取值为最值,例如α=360°或0°且β=180°或–180°时,终端在这两个自由度的晃动角度不能继续增大或减小,故此时晃动状态的转移仅有5种情况,除逗留在同一状态的概率P00外,向其它4种状态转移的概率相等,即(1P00)/4;(4) 在终端晃动的3个自由度中,3个角度的取值均为最值,例如α=360°或0°且β=180°或–180°且γ=90°或–90°时,终端在3个自由度的晃动角度不能继续增大或减小,故此时晃动状态的转移仅有4种情况,除逗留在同一状态的概率P00外,向其它3种状态转移的概率相等,即(1P00)/3

    假设Vm为如图4所示的状态空间中的某状态,其下一个跳转状态为Vn,则根据晃动终端在3自由度的角度变化范围及不同晃动状态的转移情况,可将马尔可夫链状态转移概率矩阵Q表示为

    {Q(m,n)=P00, Vm=VnQ(m,n)=(1P00)/3, VmVnVmQ(m,n)=(1P00)/4, VmVnVmQ(m,n)=(1P00)/5, VmVnVmQ(m,n)=(1P00)/6, VmVnVmQ(m,n)=0,  (10)

    其中,由于状态转移概率矩阵Q是维度为(Nα×Nβ×Nγ)×(Nα×Nβ×Nγ)的方阵,因此(m,n){(m,n)|1mNα×Nβ×Nγ, 1nNα×Nβ×Nγ

    在如图1所示的室内下行VLC系统中,当终端的晃动状态为Vm时,基于矢量传输的VLC系统容量为

    Cm=Blog2[det(I+ρHmHTmN)] (11)

    其中,B为VLC系统可用带宽,I为单位阵,N=min{NA,NU}()T表示矩阵的转置,det()表示矩阵的行列式。ρ=(ϖPt)2/(ϖPt)2σ2σ2,其中Pt为发送功率。Hm为晃动状态Vm对应的VLC矢量传输矩阵,维度为NA×NU。根据本文2.1节,Hm中第i行第j列的元素为

    hm(i,j)=η(La+1)AϖT2πd2(i,j)g(ψin,m(i,j))cosLa(ψir(i,j))cos(ψin,m(i,j)) (12)

    其中,ψin,m(i,j)表示当UEj的晃动状态为Vm时,从APi到UEj的LoS链路的入射角,其余弦值的计算方式为

    cos(ψin,m(i,j))=d(i,j)nm (13)

    其中,{\boldsymbol{d}}(i,j)为从APi到UEj的LoS链路方向矢量,{{\boldsymbol{n}}'_m}表示终端的晃动状态Vm对应的接收平面法向量,{{\boldsymbol{n}}'_m}与航向角 \alpha 、俯仰角 \beta 、横滚角 \gamma 的关系如式(6)所示。

    本文基于3维离散时间马尔可夫晃动模型,将VLC系统对晃动终端的服务过程视为离散时间马尔可夫随机服务过程。在该服务过程中,马尔可夫状态 {V_m} \in \{ 1, \cdots ,{N_\alpha } \times {N_\beta } \times {N_\gamma }\} 所对应的服务速率为 {C_m} ,如式(11)所示。在排队系统服务间隔 {T_{\text{s}}} 内,处于状态 {V_m} 的终端被服务的比特数为 {\varLambda _m} = {T_{\text{s}}}{C_m} 。根据马尔可夫晃动模型中终端晃动状态的跳转规律,随机服务过程中被服务比特数的变化情况遵循状态转移概率矩阵 {\boldsymbol{Q}} ,该矩阵为不可约的非周期状态概率转移矩阵,如式(10)所示。

    根据文献[20],利用后向方程与Perron-Frobenius定理,可将马尔可夫随机过程的对数矩生成函数推导为

    J({\theta _j}) = \frac{{\ln (\varXi ({{\text{e}}^{{\theta _j}\varLambda }}{\boldsymbol{Q}}))}}{{{T_{\text{s}}}}} (14)

    其中,{\boldsymbol{\varLambda}} = {\text{diag }} ({\varLambda _1},{\varLambda _2}, \cdots ,{\varLambda _m},{\varLambda _{m + 1}}, \cdots ,{\varLambda _{{N_\alpha } \times {N_\beta } \times {N_\gamma }}})\varXi ( \cdot )表示矩阵的最大是特征值。由于 J({\theta _j}) 满足Gartner-Ellis定理,根据文献[21],马尔可夫式随机过程的有效带宽为{B_{\rm{E}}}({\theta _j}) = {{J({\theta _j})} \mathord{\left/ {\vphantom {{J({\theta _j})} {{\theta _j}}}} \right. } {{\theta _j}}}。进一步地,本文利用有效容量与有效带宽的对偶性,推导该马尔可夫式随机服务过程下的有效容量,即支持终端晃动的VLC系统有效容量为

    {C_{\rm{E}}}({\theta _j}) = \frac{{ - \ln (\varXi ({{\text{e}}^{ - {\theta _j}\varLambda }}{\boldsymbol{Q}}))}}{{{T_{\text{s}}}{\theta _j}}} (15)

    其中, {\theta _j} 表示终端j的统计时延QoS指数, {\theta _j} 取值越大,则统计时延QoS约束更严格, {\theta _j} 取值越小,则统计时延约束越松弛。

    综上,终端晃动对有效容量的影响关系为:首先,终端晃动将对接收平面法向量产生影响,对于任意一组终端晃动角度( \alpha , \beta , \gamma ),其对接收平面法向量 {{\boldsymbol{n}}'_m} 的影响如式(6)所示;其次,接收平面法向量 {{\boldsymbol{n}}'_m} 的变化将影响LoS链路的入射角 {\psi _{{\text{in,}}m}} ,进而影响该链路的信道增益hm与VLC系统容量Cm,其影响关系如式(11)—式(13)所示;最后,在基于排队论建模的VLC系统中,终端晃动状态Vm所对应的系统容量Cm将影响队列单位时间内的服务比特数 {\varLambda _m} ,进而影响VLC系统的有效容量,影响关系如式(15)所示。

    本文考虑房间尺寸为5×5×3 m3 多光源VLC系统。VLC系统内共9个AP,且以3×3矩阵方式均匀部署于房间天花板上;共3个终端,随机分布于房间内。主要仿真参数如表1所示。

    表 1  VLC系统仿真参数
    参数符号取值单位
    LED半功率角 {\phi _{1/2}} 70°
    接收端的FoV {\varphi _{\text{c}}} 90°
    光电检测器的物理面积A1cm2
    可用带宽B20MHz
    光电检测器的响应率 \tau 0.54A/W
    噪声功率谱密度N010–21A2/Hz
    发送的光功率Pt20W
    终端和AP的垂直距离hd3m
    下载: 导出CSV 
    | 显示表格

    图5展示了终端晃动对多光源VLC系统容量的影响,其中视场角为45°。基于矢量传输的多光源VLC系统容量的计算方式如式(11)所示。由于航向角 \alpha 的变化往往取决于用户的移动方向,因此航向角 \alpha 对VLC系统容量的影响可在用户的随机室内移动的过程中达到平衡[8]。因此,图5仅体现了俯仰角 \beta 和横滚角 \gamma 对多光源VLC系统容量的影响。在多光源VLC系统中,当终端随机晃动时,若接收平面方向朝向多个光源,则容量升高;若接收平面方向背离部分光源,则容量降低。由于多光源VLC系统内的AP以3×3的矩阵方式均匀部署,因此,如图5所示,VLC系统容量随晃动俯仰角 \beta 和横滚角 \gamma 的变化呈3级阶梯状。当- 90^\circ \le \beta \le - 82^\circ时,VLC系统容量近似为0 bps;当- 20^\circ \le \beta \le 20^\circ- 20^\circ \le \gamma \le 20^\circ时,VLC系统容量达到峰值1.5×109 bps。

    图 5  终端晃动对多光源VLC系统容量的影响

    图6展示了VLC系统的有效容量随终端的统计时延QoS指数的变化情况,其中P00=0.2,视场角为45°,角度量化步长为30°。有效容量理论值的计算方式如式(14)所示,有效容量仿真值的获取方法参见文献[13]。从图6可以看出,系统有效容量的仿真值与理论值差距较小,体现了在支持终端晃动的VLC系统中,本文对基于3维离散时间马尔可夫链晃动模型的有效容量建模的准确性。由于较高的QoS指数对应较严格统计时延QoS约束,且较严格统计时延QoS约束下的VLC系统可达传输速率较小,因此,在图6中,VLC系统有效容量随终端统计时延QoS指数的增加而减小。换言之,VLC系统的统计时延QoS要求越严格,通信系统在保障该QoS的前提下能够支持的最大稳定的数据包到达速率就越小。为对比不同晃动模型下的有效容量差异性,本文将基于文献[8]中晃动模型所计算的有效容量作为对比值。从图6子图中可以看出,有效容量对比值仍保持着随QoS指数增加而减小的趋势,但其随QoS指数的变化较为缓慢。其原因在于:文献[8]从晃动极化角统计分布的角度构建了晃动模型,而本文从时间相关性的角度刻画了终端的随机晃动过程。在基于排队论的统计时延QoS分析框架中,服务过程的时间相关性可视为有效容量的决定性因素之一。因此,在考虑时间相关性的晃动模型下,终端的有效容量对QoS指数的变化更加敏感。

    图 6  VLC系统有效容量的理论值与仿真值对比

    图7展示了多光源VLC系统有效容量随终端视场角的变化趋势,其中P00=0.2,终端的统计时延QoS指数为10–8。从图7可以看出,在本文所提出的3维离散时间马尔可夫链晃动模型中,当相邻两个马尔可夫链状态之间的晃动角度量化步长固定时,增大视场角有助于为接收端增加接收光链路的机会,因此可以显著提高VLC系统有效容量。此外,当终端视场角固定时,提高晃动模型中3个晃动角度的量化步长,VLC系统有效容量将会减小。其原因在于当晃动角度量化步长减小时,晃动后VLC信道质量差的终端(例如,终端晃动后,接收平面方向朝向房间的边缘或角落)将有更多的机会被采样,从而导致VLC系统有效容量降低。

    图 7  VLC系统有效容量随视场角变化

    本文针对实际VLC系统中,终端随机晃动对统计时延QoS约束下的VLC系统传输速率的影响展开研究。考虑到随机晃动所带来的时间相关性是影响统计时延QoS分析的关键因素,本文基于3维离散时间马尔可夫链建模VLC终端的3自由度晃动过程。在此基础上,基于有效容量理论,推导晃动终端在统计时延QoS约束下的可达传输速率,并通过仿真验证了所推导有效容量的准确性及晃动模型参数、终端视场角等对晃动终端有效容量的影响。在本文研究的基础上,未来将继续探索在保障用户统计时延QoS要求的前提下,终端晃动对VLC系统组网、切换等性能的影响。

  • 图  1  算法整体框架

    图  2  YOLOv8-pose网络结构图

    图  3  关键点标注

    图  4  2维坐标系转换

    图  5  不同阶段下模型训练过程的损失曲线

    图  6  DYKL模型检测结果

    图  7  不同关键点检测算法在仿真图像上的性能对比

    图  8  不同关键点检测算法在实测图像数据上的对比结果

    图  9  与传统图像处理算法在仿真图像上的性能对比

    表  1  GPR目标自动识别算法

    文献 模型类别 算法 检测目标 数据集 性能指标(%)
    兰天等人[34] 图像学目标检测 基于拟合误差消除双曲线识别模型 / 实测图像和仿真图像 /
    Pham等人[16] 两阶段目标检测 Faster R-CNN / 50张仿真图像和100张实测图像 /
    Cui等人[18] 两阶段目标检测 Faster R-CNN 地层界面 / 检测框Pre= 98.3
    Zhao等人[20] 两阶段实例分割 Mask R-CNN 隧道衬砌上缺陷位置 / 检测框Pre=96.1
    掩模预测Pre=95.6
    Hou等人[21] 两阶段实例分割 基于MS—RCNN定制锚定方案 树根 95张实测图像 掩膜预测AP50=38.6
    Wang等人[26] 单阶段目标检测 SSD引入FPN特征融合层网络和广义交并集损失 / 1 170张仿真图像 检测框Pre=92.0
    检测框Rec=90.3
    Qiu等人[28] 单阶段目标检测 YOLOv5 铁实验材料 412张实测图像 检测框Pre=82.6
    检测框Rec=68.0
    Hu等人[29] 单阶段目标检测 YOLOv5引入注意力机制 地下缺陷 3 256张图像包含实测图像和仿真图像 检测框mAP=85.4
    胡荣明等人[30] 单阶段目标检测 YOLOv7 隧道衬砌病害 506张仿真图像和84张实测图像 检测框Pre=97.9
    检测框Rec=90.6
    Wang等人[31] 单阶段目标检测 YOLOv8引入CBAM注意力机制 地下缺陷 837张实测图像 检测框mAP50=90.8
    检测框F1=88.3
    Li等人[32] 单阶段关键点检测 YOLOv4引入关键点回归并增加Wing损失函数 植物根 1 000张仿真图像和2 320张实测图像 检测框Pre=94.0
    检测框Rec=96.7
    方涛涛等人[33] 单阶段关键点检测 YOLOv8引入 CBAM 注意力机制和关键点回归 地下管线 545张实测图像和795张仿真图像 定位水平误差8.6
    定位深度误差1.8
    下载: 导出CSV

    表  2  模型输入图像的数量与尺寸

    参数目标检测阶段关键点检测阶段
    批量大小3264
    图像尺寸640×640128×128
    下载: 导出CSV

    表  3  各种目标检测算法的平均精度与平均召回率

    模型mAP50↑mAP50-95↑Av_Recall↑
    DYKL0.9880.6420.960
    Cascade[40]0.9620.5970.675
    Faster R-CNN[17]0.9400.5460.638
    RTMDet[41]0.9050.5350.719
    下载: 导出CSV
  • [1] LI Jing, LIU Cai, ZENG Zhaofa, et al. Gpr signal denoising and target extraction with the ceemd method[J]. IEEE Geoscience and Remote Sensing Letters, 2015, 12(8): 1615–1619. doi: 10.1109/lgrs.2015.2415736.
    [2] 李洪丽, 鹿琪. 探地雷达在LNAPL污染土壤探测中的应用进展研究[J]. 地球物理学进展, 2020, 35(3): 1141–1148. doi: 10.6038/pg2020DD0414.

    LI Hongli and LU Qi. Progress in application of ground penetrating radar in LNAPL contaminated soil detection of LNAPL[J]. Progress in Geophysics, 2020, 35(3): 1141–1148. doi: 10.6038/pg2020DD0414.
    [3] 尹德, 叶盛波, 张经纬, 等. 公路结构和介电特性对探地雷达反射回波的影响研究[J]. 电子测量技术, 2018, 41(5): 51–56. doi: 10.19651/j.cnki.emt.1700792.

    YIN De, YE Shengbo, ZHANG Jingwei, et al. Study on the effect of highway structure and dielectric properties on GPR echo[J]. Electronic Measurement Technology, 2018, 41(5): 51–56. doi: 10.19651/j.cnki.emt.1700792.
    [4] 王韵, 王红雨, 常留成, 等. 基于探地雷达的水库坝前淤积土沉积规律研究[J]. 水土保持学报, 2021, 35(4): 152–158. doi: 10.13870/j.cnki.stbcxb.2021.04.021.

    WANG Yun, WANG Hongyu, CHANG Liucheng, et al. Study on sedimentation regulation of silted soil in the front of reservoir dam based on GPR[J]. Journal of Soil and Water Conservation, 2021, 35(4): 152–158. doi: 10.13870/j.cnki.stbcxb.2021.04.021.
    [5] 覃谭, 赵永辉, 林国聪, 等. 探地雷达在上林湖越窑遗址水下考古中的应用[J]. 物探与化探, 2018, 42(3): 624–630. doi: 10.11720/wtyht.2018.1290.

    QIN Tan, ZHAO Yonghui, LIN Guocong, et al. The application of GPR to underwater archaeological investigation of Shanglinhu Yue kiln relics[J]. Geophysical and Geochemical Exploration, 2018, 42(3): 624–630. doi: 10.11720/wtyht.2018.1290.
    [6] 胡进峰, 周正欧. 浅地层探地雷达目标探测和定位新方法[J]. 仪器仪表学报, 2006, 27(4): 371–375. doi: 10.3321/j.issn:0254-3087.2006.04.010.

    HU Jinfeng and ZHOU Zhengou. Target detection and orientation in sub-surface penetrating radar data[J]. Chinese Journal of Scientific Instrument, 2006, 27(4): 371–375. doi: 10.3321/j.issn:0254-3087.2006.04.010.
    [7] LIU Yayu, WANG Meiqing, and CAI Qiurong. The target detection for GPR images based on curve fitting[C]. The 2010 3rd International Congress on Image and Signal Processing, Yantai, China, 2010: 2876–2879. doi: 10.1109/CISP.2010.5646818.
    [8] LI Wentao, CUI Xihong, GUO Li, et al. Tree root automatic recognition in ground penetrating radar profiles based on randomized hough transform[J]. Remote Sensing, 2016, 8(5): 430. doi: 10.3390/rs8050430.
    [9] MAAS C and SCHMALZL J. Using pattern recognition to automatically localize reflection hyperbolas in data from ground penetrating radar[J]. Computers & Geosciences, 2013, 58: 116–125. doi: 10.1016/j.cageo.2013.04.012.
    [10] DOU Qingxu, WEI Lijun, MAGEE D R, et al. Real-time hyperbola recognition and fitting in GPR data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(1): 51–62. doi: 10.1109/tgrs.2016.2592679.
    [11] PATSIA O, GIANNOPOULOS A, and GIANNAKIS I. Background removal, velocity estimation, and reverse-time migration: A complete GPR processing pipeline based on machine learning[J]. IEEE Transactions on Geoscience and Remote Sensing, 2023, 61: 2003311. doi: 10.1109/tgrs.2023.3300276.
    [12] ZHANG Xiaowei, XUE Fangxiu, WANG Zepeng, et al. A novel method of hyperbola recognition in ground penetrating radar (GPR) B-scan image for tree roots detection[J]. Forests, 2021, 12(8): 1019. doi: 10.3390/f12081019.
    [13] LIU Bin, ZHANG Jiaqi, LEI Ming, et al. Simultaneous tunnel defects and lining thickness identification based on multi-tasks deep neural network from ground penetrating radar images[J]. Automation in Construction, 2023, 145: 104633. doi: 10.1016/j.autcon.2022.104633.
    [14] XIANG Deliang, PAN Xiaoyu, DING Huaiyue, et al. Two-stage registration of SAR images with large distortion based on superpixel segmentation[J]. IEEE Transactions on Geoscience and Remote Sensing, 2024, 62: 5211115. doi: 10.1109/tgrs.2024.3392971.
    [15] 倪志康, 叶盛波, 史城, 等. 一种深度学习辅助的探地雷达定位方法[J]. 电子与信息学报, 2022, 44(4): 1265–1273. doi: 10.11999/JEIT211072.

    NI Zhikang, YE Shengbo, SHI Cheng, et al. A deep learning assisted ground penetrating radar localization method[J]. Journal of Electronics & Information Technology, 2022, 44(4): 1265–1273. doi: 10.11999/JEIT211072.
    [16] PHAM M T and LEFÈVRE S. Buried object detection from B-scan ground penetrating radar data using faster-RCNN[C]. IGARSS 2018 - 2018 IEEE International Geoscience and Remote Sensing Symposium, Valencia, Spain, 2018: 6804–6807. doi: 10.1109/IGARSS.2018.8517683.
    [17] REN Shaoqing, HE Kaiming, GIRSHICK R, et al. Faster R-CNN: Towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137–1149. doi: 10.1109/tpami.2016.2577031.
    [18] CUI Fan, NING Muwei, SHEN Jiawei, et al. Automatic recognition and tracking of highway layer-interface using faster R-CNN[J]. Journal of Applied Geophysics, 2022, 196: 104477. doi: 10.1016/j.jappgeo.2021.104477.
    [19] 来鹏飞, 李伟, 高尧, 等. 基于改进Cascade R-CNN的探地雷达管线目标检测[J]. 计算机系统应用, 2023, 32(2): 102–110. doi: 10.15888/j.cnki.csa.008945.

    LAI Pengfei, LI Wei, GAO Yao, et al. GPR pipeline target detection based on improved Cascade R-CNN[J]. Computer Systems & Applications, 2023, 32(2): 102–110. doi: 10.15888/j.cnki.csa.008945.
    [20] ZHAO Shuai, SHADABFAR M, ZHANG Dongming, et al. Deep learning-based classification and instance segmentation of leakage-area and scaling images of shield tunnel linings[J]. Structural Control and Health Monitoring, 2021, 28(6): e2732. doi: 10.1002/stc.2732.
    [21] HOU Feifei, LEI Wentai, LI Shuai, et al. Deep learning-based subsurface target detection from GPR scans[J]. IEEE Sensors Journal, 2021, 21(6): 8161–8171. doi: 10.1109/jsen.2021.3050262.
    [22] HUANG Jian, YANG Xi, ZHOU Feng, et al. A deep learning framework based on improved self-supervised learning for ground-penetrating radar tunnel lining inspection[J]. Computer-Aided Civil and Infrastructure Engineering, 2024, 39(6): 814–833. doi: 10.1111/mice.13042.
    [23] REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: Unified, real-time object detection[C]. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, USA, 2016: 779–788. doi: 10.1109/CVPR.2016.91.
    [24] LIU Hai, LIN Chunxu, CUI Jie, et al. Detection and localization of rebar in concrete by deep learning using ground penetrating radar[J]. Automation in Construction, 2020, 118: 103279. doi: 10.1016/j.autcon.2020.103279.
    [25] 孙学超, 张其道, 尹达, 等. 基于YOLOv5s的探地雷达图像目标检测研究[J]. 交通世界, 2023(7): 3–6. doi: 10.16248/j.cnki.11-3723/u.2023.07.036.

    SUN Xuechao, ZHANG Qidao, YIN Da, et al. Research on ground penetrating radar image target detection based on YOLOv5s[J]. World of Transportation, 2023(7): 3–6. doi: 10.16248/j.cnki.11-3723/u.2023.07.036.
    [26] WANG Zhen, LAN Tian, QU Xiaodong, et al. Improved SSD framework for automatic subsurface object indentification for gpr data processing[C]. The 2021 CIE International Conference on Radar (Radar), Haikou, China, 2021: 2078–2081. doi: 10.1109/Radar53847.2021.10028347.
    [27] 覃紫馨, 姜彦南, 徐立, 等. 基于YOLO算法的探地雷达道路图像异常自动检测[J]. 科学技术与工程, 2023, 23(27): 11505–11512. doi: 10.3969/j.issn.1671-1815.2023.27.004.

    QIN Zixin, JIANG Yannan, XU Li, et al. Automatic detection of anomalies in GPR images based on YOLO algorithm[J]. Science Technology and Engineering, 2023, 23(27): 11505–11512. doi: 10.3969/j.issn.1671-1815.2023.27.004.
    [28] QIU Zhi, ZHAO Zuoxi, CHEN Shaoji, et al. Application of an improved YOLOv5 algorithm in real-time detection of foreign objects by ground penetrating radar[J]. Remote Sensing, 2022, 14(8): 1895. doi: 10.3390/rs14081895.
    [29] HU Haobang, FANG Hongyuan, WANG Niannian, et al. Defects identification and location of underground space for ground penetrating radar based on deep learning[J]. Tunnelling and Underground Space Technology, 2023, 140: 105278. doi: 10.1016/j.tust.2023.105278.
    [30] 胡荣明, 李鑫, 竞霞, 等. YOLOv7在探地雷达B-Scan图像解译中的应用[J]. 测绘通报, 2023(8): 29–33. doi: 10.13474/j.cnki.11-2246.2023.0227.

    HU Rongming, LI Xin, JING Xia, et al. Application of YOLOv7 in GPR B-Scan image interpretation[J]. Bulletin of Surveying and Mapping, 2023(8): 29–33. doi: 10.13474/j.cnki.11-2246.2023.0227.
    [31] WANG Niannian, ZHANG Zexi, HU Haobang, et al. Underground defects detection based on GPR by fusing simple linear iterative clustering phash (SLIC-Phash) and convolutional block attention module (CBAM)-YOLOv8[J]. IEEE Access, 2024, 12: 25888–25905. doi: 10.1109/access.2024.3365959.
    [32] LI Shupeng, CUI Xihong, GUO Li, et al. Enhanced automatic root recognition and localization in GPR images through a YOLOv4-based deep learning approach[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 5114314. doi: 10.1109/tgrs.2022.3181202.
    [33] 方涛涛, 王池社, 王洁, 等. 基于YOLO v8n的探地雷达图像管线定位方法[J]. 国外电子测量技术, 2023, 42(11): 170–177. doi: 10.19652/j.cnki.femt.2305179.

    FANG Taotao, WANG Chishe, WANG Jie, et al. Ground penetrating radar image pipeline location based on YOLO v8n[J]. Foreign Electronic Measurement Technology, 2023, 42(11): 170–177. doi: 10.19652/j.cnki.femt.2305179.
    [34] 兰天, 赵毅, 陈宏畅, 等. 基于拟合误差消除的探地雷达图像鲁棒双曲线识别模型[J]. 信号处理, 2023, 39(9): 1699–1710. doi: 10.16798/j.issn.1003-0530.2023.09.014.

    LAN Tian, ZHAO Yi, CHEN Hongchang, et al. A robust hyperbola recognition model with fitting-errors-based eliminating in GPR B-scan image[J]. Journal of Signal Processing, 2023, 39(9): 1699–1710. doi: 10.16798/j.issn.1003-0530.2023.09.014.
    [35] WANG C Y, BOCHKOVSKIY A, and LIAO H Y M. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[C]. 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, Canada, 2023: 7464–7475. doi: 10.1109/CVPR52729.2023.00721.
    [36] ZHOU Chuande, LU Zhenyu, LV Zhongliang, et al. Metal surface defect detection based on improved YOLOv5[J]. Scientific Reports, 2023, 13(1): 20803. doi: 10.1038/s41598-023-47716-2.
    [37] 窦智, 高浩然, 刘国奇, 等. 轻量化YOLOv8的小样本钢板缺陷检测算法[J]. 计算机工程与应用, 2024, 60(9): 90–100. doi: 10.3778/j.issn.1002-8331.2311-0070.

    DOU Zhi, GAO Haoran, LIU Guoqi, et al. Small sample steel plate defect detection algorithm of lightweight YOLOv8[J]. Computer Engineering and Applications, 2024, 60(9): 90–100. doi: 10.3778/j.issn.1002-8331.2311-0070.
    [38] XIONG Hongqiang, LI Jing, LI Zhilian, et al. GPR-GAN: A ground-penetrating radar data generative adversarial network[J]. IEEE Transactions on Geoscience and Remote Sensing, 2024, 62: 5200114. doi: 10.1109/TGRS.2023.3337172.
    [39] RUSSELL B C, TORRALBA A, MURPHY K P, et al. LabelMe: A database and web-based tool for image annotation[J]. International Journal of Computer Vision, 2008, 77(1-3): 157–173. doi: 10.1007/s11263-007-0090-8.
    [40] CAI Zhaowei and VASCONCELOS N. Cascade R-CNN: High quality object detection and instance segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021, 43(5): 1483–1498. doi: 10.1109/tpami.2019.2956516.
    [41] LYU Chengqi, ZHANG Wenwei, HUANG Haian, et al. RTMDet: An empirical study of designing real-time object detectors[J]. arXiv preprint arXiv: 2212.07784, 2022. doi: 10.48550/arXiv.2212.07784.
    [42] BOUSMAHA R, LAOUEDJ S, AGGOUNE L, et al. YOLOv7-face: A real-time face detector[C]. The 2023 International Conference on Networking and Advanced Systems (ICNAS), Algiers, Algeria, 2023: 1–6. doi: 10.1109/ICNAS59892.2023.10330470.
  • 期刊类型引用(2)

    1. 刘永立,翟伟芳,冯娟. 基于聚类分析提取特征的光通信系统异常数据检测. 激光杂志. 2024(04): 182-185 . 百度学术
    2. 王伟雄,梁有程. 点对点VLC直连宽带传输系统在5G移动网络光传输中的应用研究. 江西通信科技. 2022(04): 13-16 . 百度学术

    其他类型引用(1)

  • 加载中
图(9) / 表(3)
计量
  • 文章访问数:  654
  • HTML全文浏览量:  314
  • PDF下载量:  96
  • 被引次数: 3
出版历程
  • 收稿日期:  2024-04-08
  • 修回日期:  2024-09-12
  • 网络出版日期:  2024-09-19
  • 刊出日期:  2024-11-10

目录

/

返回文章
返回