基于垂直结构GaN LED的水下蓝光通信系统

王永进; 高羽; 王林宁; 高绪敏; 胡泽锋

doi:10.11999/JEIT220328

基于垂直结构GaN LED的水下蓝光通信系统

doi: 10.11999/JEIT220328

南京邮电大学通信与信息工程学院南京 210003

基金项目: 国家自然科学基金(61827804, 62005130)，江苏省自然科学基金(BK20200755)，“111”项目(D17018)

详细信息

作者简介:
王永进：男，1977年生，博士生导师，主要从事可见光通信系统及关键器件的研究

高羽：男，1998年生，硕士生，主要研究方向为可见光通信及系统的技术研究

王林宁：男，1995年生，博士生，主要研究方向为可见光通信及系统的技术研究

高绪敏：女，1991年生，硕士生导师，主要研究方向为III 族氮化物光电材料与器件的研究

胡泽锋：男，1998年生，硕士生，主要研究方向为可见光通信及系统的技术研究

通讯作者:
王永进　wangyj@njupt.edu.cn

中图分类号: TN929.1; TN929.3
计量
- 文章访问数: 798
- HTML全文浏览量: 854
- PDF下载量: 90
- 被引次数: 20
出版历程
- 收稿日期: 2022-03-25
- 修回日期: 2022-07-15
- 网络出版日期: 2022-07-18
- 刊出日期: 2022-08-17

Underwater Blue Light Communication UsingVertical-structure GaN Light Emitting Diode

College of Telecommunications and Information Engineering, Nanjing University of Posts and Telecommunications, Nanjing 210003, China

Funds: The National Natural Science Foundation of China (61827804, 62005130), The Natural Science Foundation of Jiangsu Province (BK20200755), The “111” Project (D17018)

摘要

摘要: 垂直结构GaN LED能够提高器件的出光效率和调制带宽，是可见光通信的关键器件。该文面向水下蓝光通信的重大应用需求，基于亚波长理想LED模型，设计、制备了垂直结构蓝光LED器件，在NRZ-OOK调制下可实现10 Mbps的无线光通信。该文进一步搭建了水下可见光通信系统，采用基于该器件，实现了调制速率2 Mbps的全双工水下蓝光通信。
- 水下蓝光通信 /
- 氮化镓 /
- 亚波长理想LED
Abstract: Ultrathin vertical-structure GaN Light Emitting Diode (LED) that can enhance light extraction efficiency as well as modulation bandwidth is a key optical element for visible light communication. In order to meet the requirement of underwater blue light communication, vertical-structure blue LED is designed and fabricated according to subwavelength vertical structure LED model. The fabricated vertical-structure LED can achieve a transmission rate of 10 Mbps under the NRZ-OOK modulation scheme. Furthermore,this vertical-structure LED is used to establish an underwater blue light communication system, which can achieve a full-duplex data communication with a modulation rate of 2 Mbps.
- Underwater blue light communication /
- Gallium Nitride /
- Subwavelength vertical-structure light-emitting diode

HTML全文

1. 引言

目标检测是计算机视觉领域的基本任务之一，现有目标检测的研究对象大都是占图像稍大部分的目标，缺少对小目标的关注^[1]。国际光学工程学会(Society of Photo-optical Instrumentation Engineers, SPIE)把小目标定义为成像小于图像尺寸0.12%的目标^[2]。一般来说，小目标是因自身体积小或成像距离远形成的，如远处无人机、车辆等，有限的像素和信息，使得对其检测仍然充满挑战^[3]。及时地发现小目标，有利于提高预警距离，在军用、民用领域都将发挥巨大作用，如可用于战场侦测敌方目标、自动驾驶避让障碍等。

本文主要研究视频监控中的运动小目标，且假定摄像机固定。此外，本文研究的小目标是占一定图像尺寸且大致满足SPIE定义的面目标，而非成像极小的点目标。在该前提下，可采用基于深度学习的检测方法，区域卷积神经网络(Regions with CNN, RCNN)是这类方法的开山之作，文献[4]提出的Faster RCNN算法以区域推荐网络(Region Proposal Network, RPN)替代RCNN中的选择性搜索，较RCNN在检测精度、速度上大幅提升，后续衍生出部分关注小目标检测的算法：文献[1]改进RPN获得推荐区域，提出结合上下文信息的CNN模型对推荐区域进行分类和回归；文献[5]提出特征金字塔网络(Feature Pyramid Network, FPN)以融合位置信息强的浅层特征和语义信息强的深层特征。这类方法尽管因采用特征融合的策略提高了检测表现，但由于缺少公开的小目标数据集，实验中的小目标通常并未达到SPIE定义的要求，当目标小到一定程度时，检测漏警率很高。还可采用基于目标运动特性的检测方法：帧差法通过视频相邻帧的差分运算判断对应像素值的改变，从而提取运动目标；光流法建立运动向量场根据像素点的速度向量特征区分运动目标；背景建模法将视频各帧图像与构建的背景模型做差分，将区别较大的像素区域视为运动目标，该方法简单，适用范围更广^[6]。混合高斯模型(Mixtures Of Gaussians, MOG), MOG2^[7]，视觉背景提取(Visual Background extractor, ViBe)和ViBe+^[8]均是经典的背景建模法，MOG算法通过多个高斯分布的混合对各个背景像素建模；MOG2算法为每个背景像素选择适当数量的高斯分布；ViBe算法建立像素点的样本集，通过将新像素点值与样本集进行匹配来判断是否属于背景；通过对距离函数、更新因子等改进，得到ViBe+算法^[9]。这类方法的主要问题是检测虚警率高，难以正确区分复杂动态背景、噪声与真实运动小目标。

针对以上两类检测方法存在的问题，本文提出一种视频监控中基于航迹的运动小目标检测算法。为了降低检测漏警率，提出区域纹理特征与差值概率融合的自适应前景提取方法，使介于预设面积范围内的疑似运动小目标(下称疑似目标)能被检出；为了降低检测虚警率，提出航迹关联的双门限虚假目标过滤方法，通过建立上一帧航迹与当前帧疑似目标的关联，计算各航迹的维持时间与撤销判断次数从而基于双门限过滤虚假目标。实验结果表明，本文算法能够有效地检测视频监控中的运动小目标。

2. 问题分析

基于深度学习的检测方法对单帧图像进行检测时，能以外接矩形框形式给出目标的位置信息和识别目标所属的类别，但由于小目标特征不明显，此类方法对小目标的检测漏警率高。基于目标运动特性的检测方法依据目标在视频帧间因位置移动产生的运动信息对存在的运动目标进行检测，对于视频各帧均能给出相应的运动前景二值图，图1(c)是利用单高斯背景建模^[10]得到的运动前景二值图，图中白色像素点被认为属于运动目标，但真实目标如图1(b)所示。评估算法的检测性能常采用如文献[6]中的定量法，其规则为：定义TP(True Positive)为被正确检测为运动前景像素点的个数，TN(True Negative)为被正确检测为背景像素点的个数，FP(False Positive)为被错误检测为运动前景像素点实际属于背景的个数，FN(False Negative)为被错误检测为背景像素点实际属于运动前景的个数，通过统计各帧检测结果中TP, TN, FP和FN值可计算实验比较量，如漏警率、虚警率等。由图1(c)可见，基于目标运动特性的检测方法虚警率高，其原因是受到动态背景、噪声和不连通前景的干扰，由此产生大量虚假目标。同时，由于小目标距离远，成像时色彩和纹理信息趋于弱化，存在其与背景的颜色亮度基本相同的情况，也易造成小目标被漏检。

图 1 视频帧图像与单高斯背景建模得到的运动前景二值图

下载: 全尺寸图片幻灯片

3. 本文算法

实施运动小目标检测，不仅可以利用视频单帧图像中的目标特征信息，还可以利用目标在帧间的关联信息。因此，本文首先利用所提区域纹理特征与差值概率融合的自适应前景提取方法实现对视频各帧中疑似目标的初步检测，然后建立疑似目标在视频帧间的关联关系，并通过所提航迹关联的双门限虚假目标过滤方法区分虚假目标和运动小目标，最后输出各帧检测结果。

3.1 疑似目标的初步检测——区域纹理特征与差值概率融合的自适应前景提取

3.1.1 区域纹理特征与差值概率融合的自适应二值化阈值设置

在摄像机固定的条件下，背景建模法常被用于运动目标检测，其计算视频各帧图像与背景模型的差值，根据预设固定阈值区分前景和背景，差值大于阈值的像素点被认为是前景。固定阈值设置过高易使小目标被漏检，而过低会导致全局性的虚检。为此，本文提出首先对视频各帧进行直方图灰度拉伸^[11]以提高图像对比度，然后采用单高斯背景建模法构建背景模型，最后将由各帧图像与背景模型得到的差值图像划分为若干个区域，基于各个区域的纹理特征和差值概率自适应地确定二值化阈值。

基于单高斯背景建模法得到的像素差值可与预设阈值比较以区分前景和背景，一般来说，差值在0附近的像素点应属于背景，较大差值的像素点应属于前景，阈值可由差值概率密度分布确定。以本文自建视频库中Camera 01视频为例，其差值图像直方图如图2所示，可见该差值分布具有递减、长尾的特点，在其它视频中也表现出该特点。本文选取具有类似递减、长尾特性的分布(Gamma，指数，Weibull, Pareto分布)对上述差值分布进行拟合，以决定系数^[12]度量拟合优度。实验表明Weibull分布拟合效果最好，因此，本文认为差值服从Weibull分布。该分布的累积分布函数如式(1)所示，其中 $\eta$ , $m$ 分别表示比例和形状参数。由此可依据式(2)确定阈值，其中 ${\rm{thr}}$ 表示阈值， ${G^{ - 1}}( \cdot )$ 表示Weibull分布的逆累积分布函数， ${p_G}$ 为预设概率，式(2)表示差值概率为 ${p_G}$ 时选取的阈值，但该阈值是全局的，未充分考虑图像的纹理特征。

图 2 差值分布拟合曲线

下载: 全尺寸图片幻灯片

$G(\partial ;\eta ,m) = \left\{ \begin{array}{l} 1 - {{\rm e}^{ - {{(\partial /\eta )}^m}}}, \partial > 0 \\ 0, \;\;\;\;\;\; \,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\partial \le \; 0 \\ \end{array} \right.$

(1)

$\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!{\rm{thr}} = {G^{ - 1}}({p_G};\eta ,m)$

(2)

对减少漏检和虚检而言，在图像不同区域设置不同的二值化阈值将比图像全局使用统一的阈值更为有效。划分区域的粒度越细，效果应越明显。因此，本文将差值图像划分为固定数目 ${N^2}$ 个区域，记为 ${A_q} (q = 1,2, ·\!·\!· ,{N^2})$ ，经验性地设置 $N = 10$ ，各区域的尺寸由式(3)决定，其中 $w$ , $h$ 分别表示划分区域的宽和高， $W\;$ , $H$ 分别表示差值图像的宽和高， $\left\lfloor \cdot \right\rfloor$ 代表向下取整。若存在边缘未被划分的区域，将其纳入相邻区域。确定各区域的阈值应考虑其纹理特征，利用灰度共生矩阵得到的纹理特征之一“倒数差分矩 ${\rm{IDF}}$ ^[13]”反映了图像纹理局部变化的大小。若图像纹理变化缓慢， ${\rm{IDF}}$ 较大，反之较小。 ${\rm{IDF}}$ 的计算如式(4)所示，其中 $a$ , $b$ 是距离为 $d$ ，角度为 $\phi$ 的某两像素的灰度级， $\phi$ 常取0°, 45°, 90°或135°, ${P_{\phi ,d}}(a,b)$ 表示共生矩阵的元素，即(a, b)灰度级对出现的次数。将差值图像按上述划分方式得到的各个区域中，存在前景运动目标或复杂背景(如树木)的区域纹理变化快， ${\rm{IDF}}$ 小；仅存在纯净背景(如天空)的区域纹理变化慢， ${\rm{IDF}}$ 大。本文按式(5)计算上述区域 ${A_q}$ 的倒数差分矩 ${\rm{IDF}}{_q}$ 以度量区域纹理变化快慢，其中 $\phi \in \{ {0^ {\circ} },{45^ {\circ} },{90^ {\circ} },{135^ {\circ} }\}$ 。

$\left. \begin{array}{l} w = \left\lfloor {W/N} \right\rfloor \\ h = \left\lfloor {H/N } \right\rfloor \\ \end{array} \right\}\hspace{80}$

(3)

$${\rm{IDF}} = \sum\limits_{a,b} {\frac{{{P_{\phi ,d}}(a,b)}}{{1 + {{(a - b)}^2}}}} $\hspace{36}$

(4)

${\rm{IDF}}{_q} = \frac{1}{4}\sum\limits_\phi {\sum\limits_{{a_q},{b_q}} {\frac{{{P_{\phi ,1}}({a_q},{b_q})}}{{1 + {{({a_q} - {b_q})}^2}}}} }$

(5)

为了减少漏检，对存在前景运动目标或复杂背景的区域可设置低阈值，由此导致的虚检通过后续方法过滤，而对仅存在纯净背景的区域应设置高阈值以减少虚检。因此，本文按式(6)确定各区域的自适应阈值，其根据各区域的倒数差分矩修正差值概率，其中 ${\rm{IDF}}{_{\max }} = \max \{ {\rm{IDF}}{_1},{\rm{IDF}}{_2}, ·\!·\!· ,{\rm{IDF}}{_{{N^2}}}\}$ , ${p_G}$ 经验性地设置为0.9。

${\rm{thr}}{_q} = {G^{ - 1}}\left(\frac{{{\rm{IDF}}{_q}}}{{{\rm{IDF}}{_{\max }}}}{p_G};\eta ,m\right)$

(6)

3.1.2 采用质心标记的疑似目标初步检测

图3可视化了疑似目标初步检测的过程，图3(a)是用矩形框标记了小目标、尺寸为 $720\; {\rm{pix}} \times 480 \; {\rm{pix}}$ 的blizzard视频帧图像。图3(b)是经过直方图灰度拉伸得到的图像，与图3(a)相比，对比度明显提高。图3(c)是利用单高斯背景建模得到的运动前景二值图，其采用3.1.1节中的二值化阈值设置方法，图中白色像素代表包含了真实运动目标的前景，由于噪声等干扰，导致前景中存在虚假目标。采用中值滤波^[14]的非线性平滑处理后的运动前景二值图如图3(d)所示，相比于图3(c)，噪声减少，但前景连通性欠佳。如图3(e)所示，通过形态学闭运算^[14]先膨胀后腐蚀的处理，一定程度上缓解了前景不连通的现象。在面积过滤处理中，计算前景中各连通区的面积，设置需要检测目标的尺寸占比，如选择占该图像尺寸0.10%～0.12%的目标进行检测，一方面滤除了部分噪声干扰，另一方面也实现了可控目标大小地检测运动小目标。相比于图3(e)，图3(f)中前景连通区数量减少，图中有多个疑似目标，为方便描述，以各自质心坐标标记，记为(centroidxⁱ, centroidyⁱ)，其中 ${\rm{centroidx}}{^i}$ , ${\rm{centroidy}}{^i}$ $(i \!=\! 1,2,3, ·\!·\!· )$ 分别表示第 $i$ 个疑似目标的质心在图像坐标下的 $x$ 坐标、 $y$ 坐标，而原图实际上只有一个满足SPIE定义的运动小目标，有效过滤其它虚假目标是本文运动小目标检测的关键。

图 3 疑似目标初步检测的可视化过程

下载: 全尺寸图片幻灯片

3.2 航迹关联的双门限虚假目标过滤

3.2.1 虚假目标过滤的总体思想

用前述方法只能得到视频各帧以质心坐标表示的疑似目标，需要判断相邻帧中哪些疑似目标属于同一个目标，从而得到同一个目标在视频帧间的一系列位置以建立轨迹(航迹)。对航迹的处理包括航迹起始、关联、撤销3个部分^[15]。其中，航迹关联是判断当前帧疑似目标是否属于已有航迹的方法。对于同一个目标，若航迹关联1次，意味着航迹维持了1帧，由此计算航迹维持帧数，本文将其称为航迹维持时间。

目标状态是由目标特征(如速度、位置)构成的向量，Kalman滤波、粒子滤波等常被用于估计目标状态。当目标运动模型为线性时，Kalman滤波是最小均方误差准则下的最佳线性滤波。由于距离摄像机远，小目标非线性的运动在成像中表现不明显，可以认为其运动趋于线性、匀速。因此，本文选取Kalman滤波估计目标状态。噪声无法形成稳定航迹，而树叶晃动等复杂背景的运动是非线性的，基于Kalman滤波进行航迹关联，不能得到较长的航迹维持时间。而由不连通前景产生的虚假目标，尽管其航迹维持时间会比因树叶等产生的虚假目标航迹维持时间更长，但仍然是短时的，可以通过设置航迹维持时间的门限进行过滤。

3.2.2 目标状态的Kalman滤波

本文选取目标质心在图像坐标下的位置和速度作为目标特征，记为 ${{\text{X}}_k} = [{x_k} \ {x_{{v_k}}} \ {y_k} \ {y_{{v_k}}}]$ ，其中， ${{\text{X}}_k}$ 为某目标在第 $k$ 帧的目标状态， ${x_k}$ , ${x_{{v_k}}}$ , ${y_k}$ , ${y_{{v_k}}}$ 分别代表第 $k$ 帧该目标质心的 $x$ 坐标、 $x$ 方向速度、 $y$ 坐标和 $y$ 方向速度。由3.1.2节方法获取相邻帧中同一个疑似目标的质心位置 $({\rm{centroidx}},{\rm{centroidy}})$ 计算得到的目标特征称为目标量测，将某目标在第 $k$ 帧的目标量测记为 ${{\text{Z}}_k} = [{\dot x_k} \ {\dot x_{{v_k}}} \ {\dot y_k} \ {\dot y_{{v_k}}}]$ ，其计算如式(7)所示。其中， ${\rm{centroidx}}{_k}$ , ${\rm{centroidy}}{_k}$ , ${\rm{centroidx}}{_{k - 1}}$ , ${\rm{centroidy}}{_{k - 1}}$ 依次代表第 $k$ 帧疑似目标质心的 $x$ 坐标、 $y$ 坐标观测值和第 $k - 1$ 帧中同一个疑似目标质心的 $x$ 坐标、 $y$ 坐标观测值， $t$ 为视频帧周期。

$\left. \begin{array}{l} {{\dot x}_k} = {\rm{centroidx}}{_k} \\ {{\dot x}_{{v_k}}} = ({\rm{centroidx}}{_k} - {\rm{centroidx}}{_{k - 1}})/t \\ {{\dot y}_k} = {\rm{centroidy}}{_k} \\ {{\dot y}_{{v_k}}} = ({\rm{centroidy}}{_k} - {\rm{centroidy}}{_{k - 1}})/t \\ \end{array} \right\}$

(7)

Kalman滤波依据上一帧目标状态的估计值和当前帧目标量测来估计当前帧目标状态，使其尽可能地拟合目标真实的运动，核心公式如式(8)—式(12)所示。

${{\widehat {\text{X}}}_{{k|k - 1}}} = {\text{F}}{{\widehat {\text{X}}}_{{k - 1|k - 1}}}\hspace{36pt}$

(8)

${{\text{P}}_{k|k - 1}} = {\text{F}}{{\text{P}}_{k - 1|k - 1}}{{\text{F}}^{\rm{T}}} + {\text{Q}}$

(9)

${{\text{K}}_k} = {{\text{P}}_{k|k - 1}}{{\text{H}}^{\rm{T}}}{\text{S}}_k^{ - 1}\hspace{33pt}$

(10)

${{\widehat {\text{X}}}_{{k|k}}} = {{\widehat {\text{X}}}_{{k|k - 1}}} + {{\text{K}}_k}{{\text{Y}}_k}\hspace{20pt}$

(11)

${{\text{P}}_{k|k}} = ({\text{E}} - {{\text{K}}_k}H){{\text{P}}_{k|k - 1}}\hspace{10pt}$

(12)

式(8)中 ${{\widehat {\text{X}}}_{{k|k - 1}}}$ 是在未获得 ${{\text{Z}}_k}$ 时对第 $k$ 帧目标状态的预测值， ${\text{F}}$ 为状态转移矩阵，由于小目标的运动趋于线性、匀速，本文 ${\text{F}}$ 如式(13)所示， ${{\widehat {\text{X}}}_{{k - 1|k - 1}}}$ 是通过Kalman滤波对第 $k - 1$ 帧目标状态的估计值，当 $k - 1 = 1$ ，需要赋初值 ${{\widehat {\text{X}}}_{_{1|1}}} = [ {\rm{centroidx}}{_1} \ 0$ ${\rm{centroidy}}{_1} \ 0]$ 。式(9)中 ${{\text{P}}_{k|k - 1}}$ 是指在未获得 ${{\text{Z}}_k}$ 时对第 $k$ 帧协方差的预测值， ${{\text{P}}_{k - 1|k - 1}}$ 是通过Kalman滤波对第 $k - 1$ 帧协方差的估计值，依据文献[16]对 ${{\text{P}}_{1|1}}$ 赋值， ${\text{Q}}$ 表示过程噪声协方差矩阵。式(10)中 ${{\text{K}}_k}$ 表示Kalman增益， ${\text{H}}$ 表示观测矩阵， ${{\text{S}}_k} = {{\text{H}}_k}$ $\!·{{\text{P}}_{k|k - 1}}{\text{H}}_k^{\rm{T}} + R$ 是新息的协方差， ${\text{R}}$ 表示观测噪声协方差矩阵。式(11)中 ${{\widehat {\text{X}}}_{_{k|k}}}$ 是指获得 ${{\text{Z}}_k}$ 后对第 $k$ 帧目标状态的估计值， ${{\text{Y}}_k} = {{\text{Z}}_k} - {{\text{H}}_k}{{\widehat {\text{X}}}_{_{k|k - 1}}}$ 为新息。式(12)中 ${{\text{P}}_{k|k}}$ 是指获得 ${{\text{Z}}_k}$ 后对第 $k$ 帧协方差的估计值， ${\text{E}}$ 为单位阵。

${\text{F}} = \left( {\begin{array}{*{20}{c}} 1&t&0&0 \\ 0&1&0&0 \\ 0&0&1&t \\ 0&0&0&1 \end{array}} \right)$

(13)

3.2.3 航迹关联的概率计算模型

由3.1.2节初步检测得到的各个疑似目标对应了一条初始航迹，其目标状态和协方差矩阵的初值由 ${{\widehat {\text{X}}}_{_{1|1}}}$ , ${{\text{P}}_{1|1}}$ 给定。虚假目标过滤的过程如图4所示，为了排除不连通前景的干扰，首先遍历当前帧各个疑似目标，若其它疑似目标的质心落在以该疑似目标的质心为圆心、半径为 $r$ 的圆中，则以平均质心位置表示这些疑似目标。为了避免来源于不同目标的运动前景被视为同一个目标产生的多个不连通前景，经验性设置了较小值 $r = 10$ 。为了对视频帧间同一个疑似目标进行关联，提出航迹关联的概率计算模型。在第 $k - 1$ 帧航迹与第 $k$ 帧疑似目标的航迹关联中，对于 $k - 1$ 帧的各条航迹，计算以该航迹在第 $k - 1$ 帧中关联的疑似目标的质心为圆心， $D = 2t\sqrt {{{({{{\widehat {\text{X}}}}_{_{k - 1|k - 1}}}[0])}^2} + {{({{{\widehat {\text{X}}}}_{_{k - 1|k - 1}}}[2])}^2}}$ 为半径的圆内的第 $k$ 帧疑似目标的关联概率。对于不在圆内的第 $k$ 帧疑似目标，将关联概率 $p$ 记为0。反之，若航迹是第 $k - 1$ 帧新起始的，则按式(14)计算航迹关联概率，式(14)是在目标量测 ${{\text{Z}}_k}$ 与 ${{\text{Z}}_{1:k - 1}}$ 相关联的概率服从高斯分布前提下构建的，其中 ${{\text{Z}}_{1:k - 1}}$ 表示某条航迹 ${{\text{Z}}_{1:k - 1}} = \{ {{\text{Z}}_1},{{\text{Z}}_2}, ·\!·\!· ,{{\text{Z}}_{k - 1}}\}$ , $p({{\text{Z}}_k}|{{\text{Z}}_{1:k - 1}})$ 代表 ${{\text{Z}}_k}$ 与 ${{\text{Z}}_{1:k - 1}}$ 的关联概率， $c$ 为 ${{\text{Y}}_k}$ 的维数，否则按式(15)计算。

图 4 航迹关联的双门限虚假目标过滤

下载: 全尺寸图片幻灯片

$\begin{align} p &= p({{\text{Z}}_k}|{{\text{Z}}_{1:k - 1}}) \hspace{120pt}\\ {\rm{}}&= \frac{1}{{{{(2{\text{π}} )}^{c/2}}\sqrt {{{\text{S}}_k}} }}\exp( - \frac{1}{2}{\text{Y}}_k^{\rm{T}}{\text{S}}_k^{ - 1}{{\text{Y}}_k}) \end{align}$

(14)

$p = p({\theta _k}) = (1 - \gamma )p({{\text{Z}}_k}|{{\text{Z}}_{1:k - 1}}) + \gamma p({\theta _{k - 1}})$

(15)

式(15)中 $\gamma$ 为权重系数，经验性地设置为0.3, ${\theta _k} = \{ {{\text{Z}}_{1:k}}{\text{表示一条真实航迹}}\}$ ，即 ${{\text{Z}}_{1:k}}$ 来源于同一个目标。至此，对于视频各帧，按式(14)或式(15)可计算上一帧航迹与当前帧疑似目标的关联概率。设上一帧航迹有 $U$ 条，当前帧疑似目标有V个，则可建立关联概率表 ${\rm{APT}}{_{U \times V\,}}$ 。按表1所示的关联规则进行关联，对各条航迹，用变量 ${\rm{Rel}}({{\text{Z}}_{1:k}})$ 来表示航迹维持时间，其初值为0，若航迹关联1次，对应航迹维持时间 ${\rm{Rel}}({{\text{Z}}_{1:k}})$ 加1。

表 1 航迹关联规则

(1) do；
(2) for $u = 1，2，·\!·· ,U$ ；
(3)　　寻找 ${\rm{APT}}{_{U \times V}\;}$ 中第 $u$ 行中的最大值 ${a_{uv}}$ ，记录其列号 $v$ ；
(4)　　if第 $v$ 列的最大值等于 ${a_{uv}}$ ；
(5)　　　　　　break；
(6)　　end if；
(7) end for；
(8) 关联 $\{ {\text{Z}}_k^v\}$ 与 $\{ \theta _{k - 1}^u\}$ ，删除 ${\rm{APT}}{_{U \times V}}\;$ 中的第 $u$ 行和第 $v$ 列元素，　　 $U = U - 1 ,V = V - 1$ ；
(9) while ${\rm{APT}}{_{U \times V}}\;$ 中存在元素大于0。

下载: 导出CSV

| 显示表格

3.2.4 基于双门限的虚假目标过滤

上一帧航迹与当前帧疑似目标的关联关系存在3种情况：一是航迹存在关联的疑似目标；二是航迹不存在关联的疑似目标；三是疑似目标不存在关联的航迹。对于关联上的航迹和疑似目标，不是简单地认为对应疑似目标就是运动小目标，而是设置航迹维持时间门限予以确定。对于上一帧任意一条航迹，若关联上了当前帧的某个疑似目标且航迹维持时间超过预设门限 ${\rm{rel}}\_{\rm{num}}$ ，即 ${\rm{Rel}}({{\text{Z}}_{1:k}}) >$ ${\rm{rel}}\_{\rm{num}}$ ，则认为该疑似目标是运动小目标，否则是虚假目标，实验表明 ${\rm{rel}}\_{\rm{num}}$ 为5时检测效果最好。对于未关联的上一帧航迹，也并非简单地撤销航迹，而是用变量 ${\rm{Del}}({{\text{Z}}_{1:k}})$ 记录该航迹进入撤销判断的次数，其初值为0，若该航迹无疑似目标关联，则将航迹撤销判断次数 ${\rm{Del}}({{\text{Z}}_{1:k}})$ 加1，当航迹撤销判断次数与航迹总帧数的比值大于另一预设门限 ${\rm{ratio}}$ 时，即 ${\rm{Del}}({{\text{Z}}_{1:k}})/{\rm{Frame}}({{\text{Z}}_{1:k}}) > {\rm{ratio}}$ ，其中 ${\rm{Frame}}({{\text{Z}}_{1:k}}) = {\rm{Del}}({{\text{Z}}_{1:k}}) + {\rm{Rel}}({{\text{Z}}_{1:k}})$ ，认为该航迹不稳定，才予以撤销，否则继续保留该航迹，经验性地设置 ${\rm{ratio}} = 0.7$ 。对于未关联的当前帧疑似目标，将其作为新的航迹进行起始。需要指出的是，视频的前几帧由于还未建立稳定的航迹，使得本文检测结果类似于传统方法，但随着时间推移，通过航迹关联，将能显著改善虚检问题。

4. 实验结果与分析

由于缺少公开的小目标数据集，本文同时选取运动目标检测公开数据集changeDetection dataset2014中包含了较小目标的视频和自建视频库，分别是：blizzard视频，存在雪花等动态背景；highway视频，包含的目标比SPIE定义稍大；Camera库(Camera 01, Camera 02)，相比于其它两个视频，包含更多的小目标，且存在树叶晃动、光照变化等多种干扰。需要明确的是，本文提出的运动小目标检测是对一段连续时间内运动小目标的持续检测，而不关注单帧图像的检测性能。为了验证算法的有效性，本文选取MOG2, ViBe+, Faster RCNN和文献[5]算法进行对比，下面从定性和定量两个方面对实验结果加以分析说明。

4.1 实验结果定性分析

定性实验结果如图5所示，第1行是标记了小目标的视频典型帧图像，第2～5行分别是MOG2, ViBe+, Faster RCNN和文献[5]算法的检测结果；第6行为本文算法检测结果。由图5可知，本文算法总体上优于其余4种算法。在blizzard视频帧中，MOG2，ViBe+算法检出小目标的局部，MOG2同时产生较多虚检，Faster RCNN和文献[5]算法均未检出小目标，而本文算法较完整地检出小目标，且不存在虚假目标。在highway视频帧中，除Faster RCNN算法外，其余算法均检出小目标，MOG2同时检出大量虚假目标。在Camera 01视频帧中，本文算法正确检出5个小目标，受动态背景干扰，MOG2检出大片虚假目标，ViBe+算法检出小目标的局部，Faster RCNN未检出小目标，而文献[5]算法检出1个小目标(汽车)。这主要是因为基于深度学习的算法受目标尺寸约束大，通过多层卷积、池化操作，小目标特征已不明显，因此表现为Faster RCNN算法难以检出小目标，而在其基础上增加特征融合策略的文献[5]算法能够检出稍大的小目标。Camera 02视频帧检测结果与Camera 01类似，MOG2和ViBe+算法产生大量虚检，Faster RCNN未检出小目标，文献[5]算法检出1个小目标(稍大电动车)，而本文算法正确检出3个小目标。

图 5 定性实验结果

下载: 全尺寸图片幻灯片

4.2 实验结果定量分析

文献[6]中评估算法性能的定量法关注各个像素点的检测情况，但当同一个运动目标被检测为多个不连通前景时，会使计算机误认为出现了多个小目标，本文认为运动小目标检测问题中更应关注检出运动小目标的个数情况。由此本文提出如下算法性能评估方法：定义TP为运动小目标被检出的个数，FN为运动小目标未被检出的个数，FP为非运动小目标(各种干扰引起的虚假目标)被检测为运动小目标的个数。以漏警率MA(Missing Alarm)和虚警率FA(False Alarm)作为实验比较量，其中， ${\rm{MA =}}$ ${\rm{ FN/(TP + FN)}}$ ，代表被漏检的运动小目标在运动小目标中的占比，该值越小越好； ${\rm{FA = FP/(TP + }}$ ${\rm{FP)}}$ ，代表被检测为运动小目标中虚假目标的占比，该值越小越好。对于上述各个算法的检测结果，若在原图存在运动小目标的位置上检出运动前景，则认为检出了该运动小目标，若出现多个检出的运动前景，则计算各个运动前景的连通区面积，取面积最大的连通区作为运动小目标的检测结果，而将其余前景视为虚假目标；若在原图存在运动小目标的位置上未检测出运动前景，则认为该运动小目标未被检出；若在原图不存在运动小目标的位置上检测出运动前景，认为该运动前景为虚假目标。由此，计算各帧的TP, FN和FP值，然后统计连续100帧TP, FN和FP值从而计算MA和FA值。

表2、表3分别给出了5种算法在不同视频中的MA和FA值。从定量实验结果看，本文算法在MA, FA两指标上的综合表现最佳。在blizzard视频中，Faster RCNN和文献[5]算法MA值最高为1, FA值最低为0，而本文算法MA值为0.31, FA值为0.18；在highway视频中，本文算法MA值最低为0.10, FA值为0.23；在Camera 01和Camera 02视频中，除基于深度学习的算法(Faster RCNN和文献[5]算法，两种算法尽管FA值最低为0，但MA值很高)外，在小目标仅占图像尺寸0.01%～0.12%的条件下，本文算法MA和FA值均最低，表明在现实场景视频监控中，本文算法能够实现对运动小目标的有效检测。

表 2 5种算法在不同视频中的MA值比较

视频	图像尺寸(pix)	检测范围(%)	像素数	MOG2	ViBe+	Faster RCNN	文献[5]	本文算法
blizzard	$720 \times 480$	0.10～0.12	345～414	0.15	0.78	1.00	1.00	0.28
highway	$320 \times 240$	0.12～0.30	92～230	1.00	0.16	1.00	0.50	0.05
Camera 01	$1920 \times 1080$	0.01～0.12	207～2488	0.38	0.29	1.00	0.86	0.11
Camera 02	$1920 \times 1080$	0.01～0.12	207～2488	0.39	0.28	1.00	0.77	0.13

下载: 导出CSV

| 显示表格

表 3 5种算法在不同视频中的FA值比较

视频	图像尺寸(pix)	检测范围(%)	像素数	MOG2	ViBe+	Faster RCNN	文献[5]	本文算法
blizzard	$720 \times 480$	0.10～0.12	345～414	0.71	0.21	0.00	0.00	0.18
highway	$320 \times 240$	0.12～0.30	92～230	0.37	0.61	0.00	0.00	0.29
Camera 01	$1920 \times 1080$	0.01～0.12	207～2488	0.51	0.25	0.00	0.00	0.13
Camera 02	$1920 \times 1080$	0.01～0.12	207～2488	0.52	0.17	0.00	0.00	0.14

下载: 导出CSV

| 显示表格

5. 结束语

本文研究视频监控中的运动小目标检测问题，最突出的特点是将对该问题的处理分解为疑似目标的初步检测和虚假目标的过滤两个阶段，并以降低漏警率和虚警率为目的，对应提出区域纹理特征与差值概率融合的自适应前景提取方法和航迹关联的双门限虚假目标过滤方法。实验结果表明，本文算法能够有效地降低检测漏警率和虚警率，较好地解决了视频监控中运动小目标难以检测的问题。

图 1 GaN垂直结构LED制备

下载: 全尺寸图片幻灯片

图 2 GaN垂直结构LED器件表征

下载: 全尺寸图片幻灯片

图 3 GaN LED通信性能测试

下载: 全尺寸图片幻灯片

图 4 FPGA软件系统框图

下载: 全尺寸图片幻灯片

图 5 发射端电路和测试波形

下载: 全尺寸图片幻灯片

图 6 接收端电路和波形测试

下载: 全尺寸图片幻灯片

图 7 水下蓝光通信系统

下载: 全尺寸图片幻灯片

表 1 水下可见光通信技术数据

光源类型	探测器类型	调制方式	数据源	数据速率(Mbps)	传输方式	距离(m)	文献/年份
LED	MPPC	PAM4	AWG	12.8	单工	2	文献[13]/2018
LED	APD	PAM8	AWG	1500	单工	1.2	文献[14]/2018
LED	SIPM	PPM	AWG	5	单工	46	文献[15]/2019
LED	SIPM	OOK	AWG	1	单工	10	文献[16]/2021
LED	APD	OOK	摄像头	2	双工	0.8	本文

下载: 导出CSV

参考文献(22)

[1]	TIAN Pengfei, LIU Xiaoyan, YI Suyu, et al. High-speed underwater optical wireless communication using a blue GaN-based micro-LED[J]. Optics Express, 2017, 25(2): 1193–1201. doi: 10.1364/OE.25.001193
[2]	LU Zhijian, TIAN Pengfei, CHEN Hong, et al. Active tracking system for visible light communication using a GaN-based micro-LED and NRZ-OOK[J]. Optics Express, 2017, 25(15): 17971–17981. doi: 10.1364/OE.25.017971
[3]	ZOU Peng, ZHAO Yiheng, HU Fangchen, et al. Underwater visible light communication at 3.24 Gb/s using novel two-dimensional bit allocation[J]. Optics Express, 2020, 28(8): 11319–11338. doi: 10.1364/OE.390718
[4]	SHEN Chao, GUO Yujian, OUBEI H M, et al. 20-meter underwater wireless optical communication link with 1.5 Gbps data rate[J]. Optics Express, 2016, 24(22): 25502–25509. doi: 10.1364/OE.24.025502
[5]	LIU Xiaoyan, YI Suyu, ZHOU Xiaolin, et al. 34.5 m underwater optical wireless communication with 2.70 Gbps data rate based on a green laser diode with NRZ-OOK modulation[J]. Optics Express, 2017, 25(22): 27937–27947. doi: 10.1364/OE.25.027937
[6]	王金龙, 高进, 吴振刚, 等. 基于商用蓝光LED的深海高速无线光通信系统[J]. 光通信技术, 2021, 45(11): 41–44. doi: 10.13921/j.cnki.issn1002-5561.2021.11.008 WANG Jinlong, GAO Jin, WU Zhengang, et al. Deep sea high-speed wireless optical communication system based on commercial blue LED[J]. Optical Communication Technology, 2021, 45(11): 41–44. doi: 10.13921/j.cnki.issn1002-5561.2021.11.008
[7]	KANG C H, TRICHILI A, ALKHAZRAGI O, et al. Ultraviolet-to-blue color-converting scintillating-fibers photoreceiver for 375-nm laser-based underwater wireless optical communication[J]. Optics Express, 2019, 27(21): 30450–30461. doi: 10.1364/OE.27.030450
[8]	KAUSHAL H and KADDOUM G. Underwater optical wireless communication[J]. IEEE Access, 2016, 4: 1518–1547. doi: 10.1109/ACCESS.2016.2552538
[9]	李丽. 基于蓝光LED的便携式水下视频通信系统[D]. [硕士论文], 南京邮电大学, 2014. LI Li. Underwater portable video communication system based on blue light LED[D]. [Master dissertation], Nanjing University of Posts and Telecommunications, 2014.
[10]	HANSON F and RADIC S. High bandwidth underwater optical communication[J]. Applied Optics, 2008, 47(2): 277–283. doi: 10.1364/AO.47.000277
[11]	WANG Jiemei, LU Chunhui, LI Shangbin, et al. 100 m/500 Mbps underwater optical wireless communication using an NRZ-OOK modulated 520 nm laser diode[J]. Optics Express, 2019, 27(9): 12171–12181. doi: 10.1364/OE.27.012171
[12]	迟楠, 王超凡, 李韦萍, 等. 基于蓝绿光LED的水下可见光通信技术研究进展[J]. 复旦学报:自然科学版, 2019, 58(5): 537–548. doi: 10.15943/j.cnki.fdxb-jns.2019.05.001 CHI Nan, WANG Chaofan, LI Weiping, et al. Research progress of underwater visible light communication technology based on blue-green LED[J]. Journal of Fudan University:Natural Science, 2019, 58(5): 537–548. doi: 10.15943/j.cnki.fdxb-jns.2019.05.001
[13]	KONG Meiwei, CHEN Yifei, SARWAR R, et al. Underwater wireless optical communication using an arrayed transmitter/receiver and optical superimposition-based PAM-4 signal[J]. Optics Express, 2018, 26(3): 3087–3097. doi: 10.1364/OE.26.003087
[14]	CHI Nan, ZHAO Yiheng, SHI Meng, et al. Gaussian kernel-aided deep neural network equalizer utilized in underwater PAM8 visible light communication system[J]. Optics Express, 2018, 26(20): 26700–26712. doi: 10.1364/OE.26.026700
[15]	SHEN Jiannan, WANG Jiongliang, YU Chuying, et al. Single LED-based 46-m underwater wireless optical communication enabled by a multi-pixel photon counter with digital output[J]. Optics Communications, 2019, 438: 78–82. doi: 10.1016/j.optcom.2019.01.031
[16]	LI Jinjia, YE Demao, FU Kang, et al. Single-photon detection for MIMO underwater wireless optical communication enabled by arrayed LEDs and SiPMs[J]. Optics Express, 2021, 29(16): 25922–25944. doi: 10.1364/OE.433798
[17]	WANG Yongjin, WU Fan, WANG Xin, et al. GaN photonics: Simultaneous emission-detection phenomenon of multiple quantum well diode[J]. SPIE, 2018, 10823.
[18]	LI Zengcheng, LIU Legong, HUANG Yingnan, et al. High-power AlGaN-based near-ultraviolet light-emitting diodes grown on Si(111)[J]. Applied Physics Express, 2017, 10(7): 072101. doi: 10.7567/APEX.10.072101
[19]	蒋成伟, 沙源清, 袁佳磊, 等. 电致发光的完全悬空超薄硅衬底氮化镓基蓝光LED器件的制备与表征[J]. 中国光学, 2021, 14(1): 153–162. doi: 10.37188/CO.2020-0148 JIANG Chengwei, SHA Yuanqing, YUAN Jialei, et al. Fabrication and characterization of an LED based on a GaN-on-silicon platform with an ultra-thin freestanding membrane in the blue range[J]. Chinese Optics, 2021, 14(1): 153–162. doi: 10.37188/CO.2020-0148
[20]	WANG Yongjin, NI Shuyu, WANG Shuai, et al. A 225-nm-thick vertical-structure light-emitting diode inhibiting confined waveguide mode[J]. Applied Physics Express, 2019, 12(4): 046503. doi: 10.7567/1882-0786/ab0664
[21]	金瑞雪. 面向可见光通信的GaN垂直结构光电器件研究[D]. [硕士论文], 南京邮电大学, 2021. JIN Ruixue. Research on GaN vertical structure optoelectronic devices for visible light communication[D]. [Master dissertation], Nanjing University of Posts and Telecommunications, 2021.
[22]	王永进, 章燕, 高绪敏, 等. 亚波长理想LED模型及实验实现[J]. 南京邮电大学学报: 自然科学版, 2019, 39(2): 1–5. doi: 10.14132/j.cnki.1673-5439.2019.02.001 WANG Yongjin, ZHANG Yan, GAO Xumin, et al. Subwavelength perfect LED architecture and experimental realization[J]. Journal of Nanjing University of Posts and Telecommunications:Natural Science Edition, 2019, 39(2): 1–5. doi: 10.14132/j.cnki.1673-5439.2019.02.001

施引文献

期刊类型引用(10)

1.	佘宇，徐焕宇，戴昕宇，张福龙，白洋洋. 利用图像超分辨率提升交通标志分类精度研究. 汽车技术. 2023(01): 15-20 . 百度学术
2.	王鹏，王雪飞. 基于快速盲复原法的激光视频监控图像光斑定位研究. 激光杂志. 2023(12): 98-103 . 百度学术
3.	李博，梁竹关，尧跃华，官铮，丁洪伟. 基于FPGA的非对称轮询控制的智能交通灯系统优化设计. 现代电子技术. 2022(05): 139-145 . 百度学术
4.	侯志强，郭浩，马素刚，程环环，白玉，范九伦. 基于双分支特征融合的无锚框目标检测算法. 电子与信息学报. 2022(06): 2175-2183 . 本站查看
5.	邝楚文，何望. 基于红外与可见光图像的目标检测算法. 红外技术. 2022(09): 912-919 . 百度学术
6.	王亚兵，曾林，高彦波，陆强，叶建军. 视频分析下变电站运动目标非法入侵检测方法. 信息技术. 2022(09): 191-196 . 百度学术
7.	向文红. 基于视频处理技术的运动轨迹实时跟踪研究. 现代电子技术. 2021(09): 48-52 . 百度学术
8.	田丹，臧守雨，涂斌斌. 具有空间调整和稀疏约束的相关滤波跟踪算法. 图学学报. 2021(05): 755-761 . 百度学术
9.	白玉，侯志强，刘晓义，马素刚，余旺盛，蒲磊. 基于可见光图像和红外图像决策级融合的目标检测算法. 空军工程大学学报(自然科学版). 2020(06): 53-59+100 . 百度学术
10.	关欣. 一种基于监控应用的视频智能分析系统. 信息通信. 2020(12): 105-107 . 百度学术

其他类型引用(10)

资源附件(0)

访问统计

图(7) / 表(1)

计量

文章访问数: 798
HTML全文浏览量: 854
PDF下载量: 90
被引次数: 20

1. 引言
2. 问题分析
3. 本文算法
3.1 疑似目标的初步检测——区域纹理特征与差值概率融合的自适应前景提取
3.2 航迹关联的双门限虚假目标过滤
4. 实验结果与分析
4.1 实验结果定性分析
4.2 实验结果定量分析
5. 结束语

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于垂直结构GaN LED的水下蓝光通信系统

doi: 10.11999/JEIT220328

通讯作者:
王永进　wangyj@njupt.edu.cn

计量

Underwater Blue Light Communication UsingVertical-structure GaN Light Emitting Diode

1. 引言

2. 问题分析

3. 本文算法

3.1 疑似目标的初步检测——区域纹理特征与差值概率融合的自适应前景提取

3.1.1 区域纹理特征与差值概率融合的自适应二值化阈值设置

3.1.2 采用质心标记的疑似目标初步检测

3.2 航迹关联的双门限虚假目标过滤

3.2.1 虚假目标过滤的总体思想

3.2.2 目标状态的Kalman滤波

3.2.3 航迹关联的概率计算模型

3.2.4 基于双门限的虚假目标过滤

4. 实验结果与分析

4.1 实验结果定性分析

4.2 实验结果定量分析

5. 结束语

期刊类型引用(10)

其他类型引用(10)

计量

目录

1. 引言

2. 问题分析

3. 本文算法

3.1 疑似目标的初步检测——区域纹理特征与差值概率融合的自适应前景提取

3.2 航迹关联的双门限虚假目标过滤

4. 实验结果与分析

4.1 实验结果定性分析

4.2 实验结果定量分析

5. 结束语

留言板

基于垂直结构GaN LED的水下蓝光通信系统

doi: 10.11999/JEIT220328

通讯作者: 王永进 wangyj@njupt.edu.cn

计量

出版历程

Underwater Blue Light Communication UsingVertical-structure GaN Light Emitting Diode

1. 引言

2. 问题分析

3. 本文算法

3.1 疑似目标的初步检测——区域纹理特征与差值概率融合的自适应前景提取

3.1.1 区域纹理特征与差值概率融合的自适应二值化阈值设置

3.1.2 采用质心标记的疑似目标初步检测

3.2 航迹关联的双门限虚假目标过滤

3.2.1 虚假目标过滤的总体思想

3.2.2 目标状态的Kalman滤波

3.2.3 航迹关联的概率计算模型

3.2.4 基于双门限的虚假目标过滤

4. 实验结果与分析

4.1 实验结果定性分析

4.2 实验结果定量分析

5. 结束语

期刊类型引用(10)

其他类型引用(10)

计量

出版历程

目录

1. 引言

2. 问题分析

3. 本文算法

3.1 疑似目标的初步检测——区域纹理特征与差值概率融合的自适应前景提取

3.2 航迹关联的双门限虚假目标过滤

4. 实验结果与分析

4.1 实验结果定性分析

4.2 实验结果定量分析

5. 结束语

通讯作者:
王永进　wangyj@njupt.edu.cn