上下文信息融合与分支交互的SAR图像舰船无锚框检测

曲海成; 高健康; 刘万军; 王晓娜

doi:10.11999/JEIT201059

上下文信息融合与分支交互的SAR图像舰船无锚框检测

doi: 10.11999/JEIT201059

辽宁工程技术大学软件学院葫芦岛 125105

基金项目: 国家自然科学基金青年基金(41701479)，辽宁省教育厅基金(LJ2019JL010)，辽宁工程技术大学学科创新团队(LNTU20TD-23)

详细信息

作者简介:
曲海成：男，1981年生，副教授，研究方向为遥感影像高性能计算、视觉信息计算、目标检测与识别

高健康：男，1996年生，硕士生，研究方向为遥感图像目标检测

刘万军：男，1959年生，教授，研究方向为数字图像处理、运动目标检测与跟踪

王晓娜：女，1994年生，硕士生，研究方向为数字图像处理

通讯作者:
高健康　gjk_0825@163.com

¹⁾ SSDD数据集下载链接：https://zhuanlan.zhihu.com/p/143794468²⁾ SAR-Ship-Dataset数据集下载：https://pan.baidu.com/s/1PhSMkXVcuRM8M8xL15iBIQ
中图分类号: TN911.73; TP751
计量
- 文章访问数: 1047
- HTML全文浏览量: 452
- PDF下载量: 101
- 被引次数: 0
出版历程
- 收稿日期: 2020-12-16
- 修回日期: 2021-05-27
- 网络出版日期: 2021-08-27
- 刊出日期: 2022-01-10

An Anchor-free Method Based on Context Information Fusion and Interacting Branch for Ship Detection in SAR Images

School of Software, Liaoning Technical University, Huludao 125105, China

Funds: The Young Scientists Fund of National Natural Science Foundation of China (41701479), The Department of Education Fund Item (LJ2019JL010) of Liaoning Province, The Discipline Innovation Team of Liaoning Technical University (LNTU20TD-23)

摘要

摘要: SAR图像中舰船目标稀疏分布、锚框的设计，对现有基于锚框的SAR图像目标检测方法的精度和泛化性有较大影响，因此该文提出一种上下文信息融合与分支交互的SAR图像舰船目标无锚框检测方法，命名为CI-Net。考虑到SAR图中舰船尺度的多样性，在特征提取阶段设计上下文融合模块，以自底向上的方式融合高低层信息，结合目标上下文信息，细化提取到的待检测特征；其次，针对复杂场景中目标定位准确性不足的问题，提出分支交互模块，在检测阶段利用分类分支优化回归分支的检测框，改善目标定位框的精准性，同时将新增的IOU分支作用于分类分支，提高检测网络分类置信度，抑制低质量的检测框。实验结果表明：在公开的SSDD和SAR-Ship-Dataset数据集上，该文方法均取得了较好的检测效果，平均精度(AP)分别达到92.56%和88.32%，与其他SAR图舰船检测方法相比，该文方法不仅在精度上表现优异，在摒弃了与锚框有关的复杂计算后，较快的检测速度，对SAR图像实时目标检测也有一定的现实意义。
- 合成孔径雷达 /
- 舰船检测 /
- 无锚框 /
- 上下文信息 /
- 自注意力
Abstract: Ship targets are sparsely distributed in Synthetic Aperture Radar (SAR) images, and the design of anchor frame has a great impact on the accuracy and generalization of existing SAR image target detection method based on anchor. Therefore, an anchor-free method based on context information fusion and interacting branch for ship detection in SAR images (named as CI-Net) is proposed. Considering the diversity of ship scale in SAR images, a context fusion module is designed in the feature extraction stage, integrate high and low levels of information in a bottom-up manner and refine the extracted features to be detected by combining with the target context information. Secondly, aiming at the problem of complex targets in the scene is not accurate, interacting branch module is put forward. In the detection phase, use classification branches optimization regression testing box is used, to improve the target frame’s precision. At the same time, the new Intersection over Union (IOU) is used on branches of the classification to improve detection network classification confidence, to inhibit detection box of low quality. Experimental results show that the proposed method achieves good detection results on both SSDD and SAR-Ship-Dataset, with Average Precision (AP) reaching 92.56% and 88.32%, respectively. Compared with other ship detection methods in SAR image, the proposed method not only has excellent performance in accuracy, but also has a faster detection speed after abandoning the complex calculation related to anchor frame. It also has a certain practical significance for real-time target detection in SAR image.
- Synthetic Aperture Radar (SAR) /
- Ship detection /
- Anchor-free /
- Context information /
- Self-attention
¹⁾ SSDD数据集下载链接：https://zhuanlan.zhihu.com/p/143794468²⁾ SAR-Ship-Dataset数据集下载：https://pan.baidu.com/s/1PhSMkXVcuRM8M8xL15iBIQ

HTML全文

1. 引言

随着对海洋资源开发、海洋权益维护等的日益重视，水声通信技术在军事和民用水下信息传输领域的重要性日益显现。但复杂多变的水声信道给信息的可靠传输带来了挑战，信号在高速率传输过程中会同时面临时变、严重码间干扰及衰落的影响^[1]。为了解决此问题，通常考虑采用自适应均衡与分集技术。

自适应均衡是一种在接收机处进行自适应信号补偿的技术，可有效抑制码间干扰及噪声，矫正和补偿信道特性，从而可提高通信系统的可靠性。在水声通信中应用的传统自适应均衡算法主要有两种：最小均方误差(Least Mean Square, LMS)类自适应算法^[2]和递归最小二乘(Recursive Least Square, RLS)类自适应算法^[3]。相较于LMS，基于RLS类的自适应算法收敛性能更好，但其计算复杂度较高。而水声信道延迟扩展时间大，会导致严重的码间干扰，故传统自适应均衡算法由于其结构上的局限性，难以取得较好的误码率性能。近年来出现的深度学习算法，凭借其强大的学习能力和非线性拟合能力，成为了水声信道均衡算法研究的热点^[4]，给取得更好码间干扰消除效果带来了可能。文献[5]分别使用多层感知器(Multi-Layer Perceptron, MLP)和递归神经网络(Recursive Neural Network, RNN)实现了信道均衡，能获得比传统自适应均衡算法更好的误码率性能，但其仅能处理多径信道数很少的情况。文献[6]使用卷积递归神经网络(Convolutional Recursive Neural Network, CRNN)设计信道均衡器，可实现误码率性能的进一步改善。但CRNN存在局部最优解问题，且复杂度及训练成本较高，文献[7]考虑将5层深度神经网络(Deep Neural Network, DNN)应用到水声OFDM通信系统中，用于检测恢复发送端发送的信息。目前关于神经网络用于均衡方面的研究，还仅局限于单分支情况。

由于水下声波的衰落及传播特性，可考虑在水声通信中采用单发多收(Single Input Multiple Output, SIMO)分集技术，通过利用多个衰落相互独立的水声信道传送相同的信息，可更好地捕获声信号的能量及抵抗衰落的影响，改善水声通信链路的可靠性。在目前的分集技术中，主要的合并技术包括：等增益合并和最大比合并^[8]。最大比合并性能最好，但其实现需已知对应各个分支的信道状态信息，而实际的水声环境下，换能器间的信道状态信息是难以获得的，因此，此方法不太适合于实际的水声通信系统。此外，在高速水声通信中，还存在码间干扰，因此不能仅采用合并技术处理，还需采用均衡技术，但如果多分支合并与均衡间相互独立，并不能充分发挥两者的联合性能，因此需考虑如何将多分支合并与均衡联合实现。文献[9]提出一种多分支合并与均衡联合实现算法，该自适应算法可基于LMS和RLS算法实现。文献[10]提出了一种基于归一化最小均方(Normalized Least Mean Square, NLMS)的多分支合并与均衡联合实现算法。文献[11]提出了一种基于均方误差准则的多分支合并与均衡算法，但其本质实现上仍然是各分支相互独立的。据文献调研可知，尽管在均衡领域，已有研究将智能学习算法用于均衡器，但还未有考虑基于智能学习方法将多分支合并和均衡联合实现的研究出现。

针对水声信道中严重衰落及码间干扰问题，本文提出一种基于深度学习的联合多分支合并与均衡算法。该算法基于DNN实现，可利用其强大学习能力和非线性拟合能力，更好的实现合并和消除码间干扰，在其实现中，多分支合并与均衡是联合实现的，可进一步提高联合性能。仿真结果验证了所提算法的可行性，也验证了其相对于已有方法的优势。

2. 系统模型

本文研究针对SIMO单载波水声通信系统，发射端有一个换能器，接收端有 $N$ 个水听器，如所示。在中， $h$ 表示海水的深度， ${h_{\text{t}}}$ 表示发射端换能器距海底的距离， ${h_{{d}}}(i)$ 表示接收端第 $i$ 个水听器序距海底距离， $i \in \{ 1,2, \cdots ,N\}$ ，d表示换能器与水听器阵列的水平距离， ${h_i}(n)$ 表示换能器与第 $i$ 个水听器间水声信道的冲激响应，假设发射端换能器与接收端 $N$ 个水听器间的水声信道 ${h_i}(n)$ 是相互独立的。

图 1 水声SIMO通信系统示意图

下载: 全尺寸图片幻灯片

在此模型下，接收端第 $i$ 个水听器的接收信号 ${r_i}(n)$ 可，其可表述为下式

${r_i}(n) = s(n) * {h_i}(n) + {\xi _i}(n)$

(1)

其中 $i \in \{ 1,2, \cdots ,N\}$ ， $s(n)$ 表示独立等概率二进制相移键控(Binary Phase Shift Keying, BPSK)调制信号， $s(n) \in \{ - 1,1\}$ ， $*$ 表示卷积运算， ${\xi _i}(n)$ 表示零均值，方差为 $\sigma _i^{\text{2}}$ 的加性高斯白噪声。

3. 基于深度学习的联合多分支合并与均衡

高速水声通信会同时面临水声通信中时变、严重码间干扰及衰落的影响，为了改善水声通信链路的可靠性，需要考虑同时解决。目前，已有合并均衡方法基于MMSE标准实现，深度学习方面则仅考虑了单分支情况，还未考虑多分支情况。本文提出了一种基于深度学习的联合多分支合并与均衡算法(Joint Multi-branch Merging and Equalization based on Deep Learning, JMME-DL)，该算法与已有算法相比具有以下不同之处：(1)该算法基于深度学习网络实现了多分支均衡；(2)多分支合并和各分支均衡并非相互独立，而是联合实现的。

本文所提出JMME-DL算法的结构示意图如图2所示，该算法将直接处理各水听器接收到的信号，经如图2所示的深度学习网络处理后，通过判决即可恢复发送端发送的数据。

图 2 JMME-DL算法结构示意图

下载: 全尺寸图片幻灯片

由可知，各分支网络和对各分支网络输出的合并并非相互独立，而是基于网络总输出计算误差进行联合更新的，每个分支会同时处理相应分支的若干组数据，第 $i$ 个分支的第 $1$ 层神经网络输入 ${{\boldsymbol{o}}}_i^{{\text{(1)}}}$ 可表示为

${{\boldsymbol{o}}}_i^{{\text{(1)}}}{{ = }}\left[ \begin{array}{ccccccccccccccccccccc} {{r_i}(n),} & {{r_i}(n - 1),} & \cdots & {{r_i}(n - {M_i} + 1)} \\ {{r_i}(n + 1),} & {{r_i}(n),} & \cdots & {{r_i}(n - {M_i} + 2)} \\ \vdots & \vdots & \ddots & \vdots \\ {r_i}(n + K - 1), & \cdots & \cdots & {{\text{ }}{r_i}(n - {M_i} + K)} \end{array} \right]$

(2)

其中， $i \in \{ 1,2, \cdots ,N\}$ ， $K$ 表示每个分支1次处理的组数(这里假设各分支的组数均为相同的)， ${M_{\text{i}}}$ 表示各个分支DNN网络的输入层神经元的数量。设各个分支的深度神经网络(DNN)的层数均为 $L$ ，若第i个分支的第 $l$ 层输出为 ${{\boldsymbol{o}}}_i^{{\text{(}}l{\text{)}}}$ ，则第 $l + 1$ 层的输出可通过下式计算得出

${{\boldsymbol{o}}}_i^{(l + 1)} = f_i^{(l)}({{\boldsymbol{o}}}_i^{(l)}) = {f_i}({{\boldsymbol{\theta}} }_{^{(i)}}^{^{(l)}}{{\boldsymbol{o}}}_i^{(l)} + {\boldsymbol{b}}_{^{(i)}}^{^{(l)}})$

(3)

其中， ${{\boldsymbol{\theta}} }_{^{(i)}}^{^{(l)}}$ 代表第 $i$ 个分支网络中第 $l$ 层的权重矩阵， ${{\boldsymbol{\theta}} }_{^{(i)}}^{^{(l)}} = \{ \theta _{(i)j,k}^{(l)}\}$ , ${\boldsymbol{b}}_{^{(i)}}^{^{(l)}}$ 代表第 $i$ 个分支网络中第 $l$ 层的偏置向量， ${\boldsymbol{b}}_{^{(i)}}^{^{(l)}} = \{ b_{^{(i)}j}^{^{(l)}}\}$ ， ${f_i}( \cdot )$ 表示SIGMOID激活函数，如所示， $f_i^{(l)}( \cdot )$ 表示第 $l$ 层的激活函数。网络层数增加时，每一层输入的分布会逐渐偏移，这会导致某些层的输入落入激活函数 ${f_i}( \cdot )$ 的饱和区内，造成梯度消失，从而导致网络参数无法更新。为了解决梯度消失引起的“梯度弥散”问题，在图2中的每一层前均加入正则化(Batch Normalization, BN)层，BN层能将每一层的输入信息变换为服从均值为0，方差为1的标准正态分布的序列，信息经这样的正则化处理后，就可落入激活函数的敏感区域，梯度变化大，可加快网络的收敛速度。

图 3 SIGMOID激活函数示意图

下载: 全尺寸图片幻灯片

由于采用的调制方式是BPSK调制，故可将其看作是一个二分类的问题。鉴于SIMOID激活函数的输出值取值范围为(0,1)，这里将BPSK调制值取“+1”时定义为正向类“1”，取“–1”时定义为负向类“0”，阈值取0.5，在判决时可根据估计值与0.5的大小关系，判决恢复发送端发送的信息。由所示，第 $L - 1$ 层间的输出可表示为

${{\boldsymbol{o}}}_i^{(L - 1)} = {f^{(L - 1)}}\left({f^{(L - 2)}}\left(\left( \cdots {f^{(1)}}({{\boldsymbol{o}}}_i^{(1)})\right)\right)\right)$

(4)

最后总网络的输出 ${\tilde s_{{\text{total}}}}$ 由各分支的输出加权得到 ${\tilde {\boldsymbol{s}}_{\rm{total}}} = f \left(\displaystyle\sum\limits_i^n \left({\boldsymbol{\theta}}_{{(i)}}^{{(L - 1)}}{{\boldsymbol{o}}}_i^{(L - 1)} + {\bf{b}}_{{(i)}}^{{(L - 1)}} \right)\right)$ 。考虑通信的目的是传递信息，期望接收端能正确恢复信息，故定义深度学习网络的损失函数为

${\text{Loss}}({\boldsymbol{\theta}} ,{\boldsymbol{b}}) = \frac{1}{K}{\left\| {{\boldsymbol{s}} - {{{\boldsymbol{\tilde s}}}_{{\text{total}}}}} \right\|^2}$

(5)

其中， ${s}$ 表示期望信息 $s = [s((n - 1)K + 1), \cdots , s(nK)]$ ， $n = 1,2, \cdots$ ， ${\tilde {\boldsymbol{s}}_{{{\mathrm{total}}}}}$ 表示对 ${{\boldsymbol{s}}}$ 的估计值。从式(5)可以看出，损失函数取值越小，可以使得对信息的估计值越逼近于期望值，故可通过最小化损失函数求得最优化的网络参数(权重矩阵和偏置向量)。为了能使算法自适应于信道，可推导出令此损失函数最小的自适应算法。由随机梯度下降法，可得权重矩阵和偏置向量的更新公式为

${\boldsymbol{\theta }}_{(i)}^{{(l)}} = {\boldsymbol{\theta }}_{{(i)}}^{{(l)}} - \alpha \frac{{\partial L}}{{\partial {\boldsymbol{\theta }}_{{(i)}}^{{(l)}}}}{\text{ }}(l = 1,2, \cdots ,L - 1)$

(6)

${{\boldsymbol{b}}}_{(i)}^{(l)} = {{\boldsymbol{b}}}_{(i)}^{(l)} - \alpha \frac{{\partial L}}{{\partial {{\boldsymbol{b}}}_{(i)}^{(l)}}}{\text{ }}(l = 1,2, \cdots ,L - 1)$

(7)

其中， $\alpha$ 表示学习率，其取值严重影响深度神经网络的收敛及稳态性能。根据反向传播算法，更新过程中的偏导部分可由下式计算得出

$\begin{split} \frac{{\partial L}}{{\partial {{\boldsymbol{\theta}} }_{{(i)}}^{^{(L - 1)}}}} =\,& \frac{{\partial L}}{{\partial {{\boldsymbol{o}}}_i^{(L - 1)}}}\frac{{\partial {{\boldsymbol{o}}}_i^{(L - 1)}}}{{\partial {{\boldsymbol{\theta}} }_{{(i)}}^{{(L - 1)}}}} = {({{\boldsymbol{o}}}_i^{(L - 2)})^{\mathrm{T}}}(({\boldsymbol{s}} - {\tilde {\boldsymbol{s}}_{{\text{total}}}}) \\ & \odot f'(\sum\limits_i^n \left({{\boldsymbol{\theta}} }_{{(i)}}^{{(L - 1)}}{{\boldsymbol{o}}}_i^{(L - 1)} + {{\boldsymbol{b}}}_{{(i)}}^{{(L - 1)}} \right)))\\[-1pt] \end{split}$

(8)

$\begin{split} \frac{{\partial L}}{{\partial {{\boldsymbol{b}}}_{{(i)}}^{{(L - 1)}}}} =\,& \frac{{\partial L}}{{\partial {{\boldsymbol{o}}}_i^{(L - 1)}}}\frac{{\partial {{\boldsymbol{o}}}_i^{(L - 1)}}}{{\partial {{\boldsymbol{b}}}_{{(i)}}^{{(L - 1)}}}} = {\text{sum}}\{ ({\boldsymbol{s}} - {\tilde s_{{\text{total}}}}) \\ & \odot f' \sum\limits_i^n {({{\boldsymbol{\theta}} }_{{(i)}}^{{(L - 1)}}{{\boldsymbol{o}}}_i^{(L - 1)} + {{\boldsymbol{b}}}_{{(i)}}^{{(L - 1)}}} )\} \end{split}$

(9)

其中， $\odot$ 表示哈达玛积， ${( \cdot )^{\text{T}}}$ 表示矩阵转置， ${\text{sum}}\{ \}$ 表示对矩阵按列求和。由式(9)，为了表述方便，定义神经网络第 $L - 1$ 层的误差项 ${{\boldsymbol{\delta}} }_i^{^{L - 1}}$ 为

$\begin{split} {{\boldsymbol{\delta}} }_i^{{L - 1}} =\,& \frac{{\partial L}}{{\partial {{\boldsymbol{o}}}_i^{(L - 1)}}} = ({\boldsymbol{s}} - {\tilde {\boldsymbol{s}}_{{\text{total}}}})\\ & \odot f'\left(\sum\limits_i^n \left({{\boldsymbol{\theta}} }_{{(i)}}^{{(L - 1)}}{{\boldsymbol{o}}}_i^{(L - 1)} + {{\boldsymbol{b}}}_{{(i)}}^{{(L - 1)}} \right)\right) \end{split}$

(10)

类比可推导出第 $l$ 层的误差为

${{\boldsymbol{\delta}} }_i^{l} = \frac{{\partial L}}{{\partial {{\boldsymbol{o}}}_i^l}} = ({\boldsymbol{s}} - {\tilde {\boldsymbol{s}}_{{\text{total}}}}) \odot f' \left(\sum\limits_i^n \left({{\boldsymbol{\theta}} }_{{(i)}}^{{(l)}}{{\boldsymbol{o}}}_i^{(l)} + {{\boldsymbol{b}}}_{{(i)}}^{{(l)}} \right)\right)$

(11)

由式(8)–式(11)，对第 $i$ 分支第 $l$ 层的更新公式可表示为

$\frac{{\partial L}}{{\partial {{\boldsymbol{\theta}} }_{{(i)}}^{{(l)}}}} = {({{\boldsymbol{o}}}_i^{(l - 1)})^{\text{T}}}{{\boldsymbol{\delta}} }_i^l{\text{ }}(l = 1,2, \cdots ,L - 1)$

(12)

$\frac{{\partial L}}{{\partial {{\boldsymbol{b}}}_{{(i)}}^{{(l)}}}} = {\text{sum}}\{ {{\boldsymbol{\delta }}}_i^l{\text{\} }}(l = 1,2, \cdots ,L - 1)$

(13)

将式(12)–式(13)代入式(6)–式(7)，可得JMME-DL自适应算法

${{\boldsymbol{\theta}} }_{(i)}^{{(l)}} = {{\boldsymbol{\theta}} }_{^{(i)}}^{{(l)}} - \alpha {({{\boldsymbol{o}}}_i^{(l - 1)})^{\text{T}}}{{\boldsymbol{\delta}} }_i^l{\text{ }}(l = 1, \cdots ,L - 1)$

(14)

${{\boldsymbol{b}}}_{{(i)}}^{{(l)}} = {{\boldsymbol{b}}}_{{(i)}}^{{(l)}} - \alpha {{\boldsymbol{\delta}} }_i^l{\text{ }}(l = 1, \cdots ,L - 1)$

(15)

综上，所提JMME-DL算法实现过程如算法1所示。

表 1 JMME-DL算法

输入：训练集： $\mathcal{D} = \left\{ {\left( {{r_i}(n),s(n)} \right)} \right\}_{i = 1}^N$ 中 $K$ 组数据；验证集：
$V$ ；学习率： $\alpha$ ；正则化系数： $\lambda$ ；迭代次数： $M$
初始化： ${\boldsymbol{\theta}} ,{\boldsymbol{b}}$
repeat
for i = 1 2 ··· M do
(1) 从训练集 $\mathcal{D}$ 中选取 $K$ 组数据样本
(2) 前馈计算，直到最后一层并计算总输出
(3) 反向传播计算每一层的误差
// 计算每一层参数的导数
$\dfrac{{\partial L}}{{\partial {{\boldsymbol{\theta}} }_{^{(i)}}^{^{(l)}}}} = {({{\boldsymbol{o}}}_i^{(l - 1)})^{\text{T}}}{{\boldsymbol{\delta}} }_i^l{\text{ }}(l = 1, \cdots ,L - 1)$
$\dfrac{{\partial L}}{{\partial {{\boldsymbol{b}}}_{^{(i)}}^{^{(l)}}}} = {\text{sum}}\{ {{\boldsymbol{\delta}} }_i^l{\text{\} }}(l = 1, \cdots ,L - 1)$
// 更新参数
${{\boldsymbol{\theta}} }_{(i)}^{^{(l)}} = {{\boldsymbol{\theta }}}_{^{(i)}}^{^{(l)}} - \alpha {({{\boldsymbol{o}}}_i^{(l - 1)})^{\text{T}}}{{\boldsymbol{\delta}} }_i^l{\text{ }}(l = 1, \cdots ,L - 1)$
${{\boldsymbol{b}}}_{^{(i)}}^{^{(l)}} = {{\boldsymbol{b}}}_{^{(i)}}^{^{(l)}} - \alpha {{\boldsymbol{\delta}} }_i^l{\text{ }}(l = 1, \cdots ,L - 1)$
until训练的模型在验证集 $V$ 的错误率不再下降；
输出： ${\boldsymbol{\theta}} ,{\boldsymbol{b}}$

下载: 导出CSV

| 显示表格

4. 仿真结果与分析

4.1 仿真条件

在仿真中，假设水声信道是半稳态的，即在一个数据包的发送过程中，信道是不变的，但对下一个数据包的传输来说，信道会发生变化。每个数据包由训练序列和数据序列构成。每个数据包的长度为1008个符号，其中前400个符号为训练序列，用于对网络的训练，后608个符号为数据信息，用于对网络的测试。在仿真中，JMME-DL各分支网络的输入神经元个数设定为16。为了在训练长度为400时得到更多的训练样本，各分支构成样本时，采用重复使用的方式，即第1～16个采样值构成第1个样本，2～17构成第2个样本，依次类推，400个训练符号可形成400组训练样本。换能器和水听器间的水声信道冲激响应基于文献[12]中的统计水声信道模型得出，所使用主要参数如所示，基于此水声信道模型可构建蒙特卡洛仿真，据中参数设置产生的水声信道冲激响应如所示。在仿真中深度学习网络的学习率 $\alpha$ 设置为0.005，正则化系数 $\lambda$ 设置为0.8，迭代次数 $M$ 设置为100。为了验证本文提出JMME-DL算法的有效性，与已有算法进行了误码率和收敛性能的对比，在仿真图中的误码率和收敛曲线分别以平均多个数据包下的相应曲线得出。

表 1 水声信道仿真主要参数

仿真参数	数值
海水深度(m)	300
发射机深度(m)	100
水听器1深度(m) 水听器2深度(m)	120 125
水听器3深度(m)	130
发射机与水听器水平距离(m)	3000
水下传播系数	1.6
水下声速(m/s)	1500
载波频率(kHz)	10
带宽(kHz)	5

下载: 导出CSV

| 显示表格

图 4 发射机与各个水听器间的信道冲激响应

下载: 全尺寸图片幻灯片

4.2 仿真结果与分析

本文选取对比算法如下：(1)文献[10]提出的基于NLMS的联合多分支合并与均衡算法(Joint Multi-branch Merging and Equalization based on NLMS, JMME-NLMS)。(2)文献[6]提出的基于卷积递归神经网络(CRNN)算法和等增益合并相结合的多分支处理算法，各分支是相互独立的，但对各分支的输出进行等增益合并，称之为基于CRNN的等增益合并多分支均衡算法(Equal-Gain Combing Multi-branch Equalization based CRNN, EGC-ME-CRNN)。(3)基于深度学习的单分支均衡算法(Single-branch Equalization based on Deep Learning, SE-DL)。(4)基于深度学习的均衡和等增益合并相结合的算法，各分支相互独立，仅对各分支的输出进行等增益合并，称之为基于DL的等增益合并多分支均衡算法(Equal-Gain Combing Multi-branch Equalization based on Deep Learning, EGC-ME-DL)。

深度神经网络的非线性拟合能力与网络层数具有一定关系，网络层数过少，非线性拟合能力较差；而网络层数过多时，可能导致过拟合，因此，深度神经网络的层数严重影响JMME-DL的性能。有鉴于此，首先通过仿真研究了网络层数对误码率性能的影响。在构建各分支深度神经网络时，假设不同分支的神经网络层数和结构相同。图5给出了网络层数对误码率性能的影响，图中分别给出了各分支网络层数为4层、5层、6层、7层和8层时的误码率曲线：4层网络结构为16-16-32-1；5层网络结构为16-16-24-32-1；6层网络结构为16-16-24-32-24-1；7层网络结构为16-16-24-32-24-16-1；8层网络结构为16-16-24-32-36-24-16-1。从图5可以看出，随着层数的增加，JMME-DL的误码率性能会有进一步的性能改善，但当层数达到一定程度时，再进一步增加层数时，误码率性能不会有较大的提升，反而会增加算法的复杂度。本文中在考虑网络层数的设定时，是考虑保证算法性能的同时，令网络尽可能轻量(计算复杂度低)。故综合考虑误码率性能和算法复杂度，选择各分支的网络层数为6会是一个较好的折衷。因此，在后续仿真中，设置各分支的网络层数为6。

图 5 网络层数对算法性能的影响对比图

下载: 全尺寸图片幻灯片

图6给出了SE-DL, EGC-ME-DL, JMME-NLMS, EGC-ME-CRNN和所提JMME-DL算法间的误码率性能比较。从图6可以看出，EGC-ME-DL, JMME-NLMS, EGC-ME-CRNN和所提JMME-DL算法的误码率性能优于SE-DL。这是因为这几种算法都是多分支算法，相对于SE-DL来说，可以获得分集增益。从图6还可以看出，EGC-ME-DL, EGC-ME-CRNN和所提JMME-DL算法能获得比JMME-NLMS更好的误码率性能，这是因为这几种算法都是基于神经网络实现，其具有强大的非线性拟合能力，能更好地消除码间干扰。此外，我们还可以看出所提JMME-DL的误码率性能优于EGC-ME-DL、EGC-ME-CRNN算法。这是因为JMME-DL是基于深度学习网络实现的，且在其实现过程中，各分支网络和多分支的合并并非是相互独立的，而是联合实现的。

图 6 水声信道下算法误码率性能比较

下载: 全尺寸图片幻灯片

图7给出了不同算法的收敛性能比较，横轴表示深度学习算法的迭代次数。从图7中可以看出EGC-ME-DL和EGC-ME-CRNN的收敛速度接近，而所提JMME-DL算法能获得比EGC-ME-DL和EGC-ME-CRNN更好的收敛速度。此外，还可以从图7中看出，所提JMME-DL算法达到的损失函数值小于EGC-ME-DL和EGC-ME-CRNN算法，这与图6中的误码率性能是一致的，损失函数值越小，误码率性能越好，这反过来也证明了图6中结果的正确性。

图 7 水声信道下算法收敛曲线

下载: 全尺寸图片幻灯片

5. 结束语

考虑更好地消除严重多径导致的码间干扰及抗水声信道衰落，本文提出一种基于深度学习的联合多分支合并与均衡算法。在该算法中，多分支合并和均衡并不是相互独立的，而是基于设计的深度学习网络联合实现的，因而能获得更好的合并与均衡性能。仿真结果表明，与已有算法相比，所提JMME-DL算法能借助深度学习网络的非线性拟合能力，更有效地消除码间干扰，从而获得更好的收敛及误码率性能。

¹⁾ SSDD数据集下载链接：https://zhuanlan.zhihu.com/p/143794468²⁾ SAR-Ship-Dataset数据集下载：https://pan.baidu.com/s/1PhSMkXVcuRM8M8xL15iBIQ

图 1 无锚框的检测模型

下载: 全尺寸图片幻灯片

图 2 CI-Net检测模型框架

下载: 全尺寸图片幻灯片

图 3 上下文融合模块

下载: 全尺寸图片幻灯片

图 4 GCNet结构

下载: 全尺寸图片幻灯片

图 5 自注意力模块

下载: 全尺寸图片幻灯片

图 6 检测结果对比图

下载: 全尺寸图片幻灯片

图 7 上下文融合模块特征可视化

下载: 全尺寸图片幻灯片

图 8 不同方法的P-R曲线图

下载: 全尺寸图片幻灯片

表 1 舰船数据集的基本信息

数据集	传感器来源	空间分辨率(m)	极化方式	输入图像大小	场景
SSDD	RadarSat-2, TerraSAR-X, Sentinel-1	1～15	VV, HH, VH, HV	500×500	近海、近岸区域
SAR-Ship Dataset	GF-3, Sentinel-1	3, 5, 8, 10等	VV, HH, VH, HV	256×256	远海区域

下载: 导出CSV

表 2 模型实验结果

方法	上下文融合(CF)	分支交互(IB)	召回率(%)	准确率(%)	平均精度(%)	F₁(%)	fps
FCOS^[14]	×	×	88.64	88.44	86.27	88.54	23
本文	√	×	92.23	86.60	90.69	89.32	29
FCOS^[14]	×	√	90.31	93.41	88.42	91.83	22
本文	√	√	94.27	92.04	92.56	93.14	28
注：“×”表示没有采用该模块。“√”表示采用该模块。加粗值为每列最优结果。

下载: 导出CSV

表 3 不同方法在SSDD数据集上检测性能对比

方法	单阶段	无锚框	召回率(%)	准确率(%)	平均精度(%)	F₁(%)	fps
Faster R-CNN	×	×	85.39	84.18	83.07	84.78	11
RetinaNet	√	×	89.40	90.43	87.94	89.91	16
DCMSNN	×	×	91.59	88.33	89.34	89.93	8
本文CI-Net	√	√	94.27	92.04	92.56	93.14	28

下载: 导出CSV

表 4 不同方法在SAR-Ship-Dataset上检测性能对比

方法	单阶段	无锚框	召回率(%)	准确率(%)	平均精度(%)	F₁(%)	fps
Faster R-CNN	×	×	84.30	84.47	81.77	84.39	13
RetinaNet	√	×	84.60	85.83	82.02	85.21	21
DCMSNN	×	×	86.64	88.07	84.36	87.35	9
本文CI-Net	√	√	90.28	88.14	88.32	89.20	34

下载: 导出CSV

参考文献(23)

[1]	杨国铮, 禹晶, 肖创柏, 等. 基于形态字典学习的复杂背景SAR图像舰船尾迹检测[J]. 自动化学报, 2017, 43(10): 1713–1725. doi: 10.16383/j.aas.2017.c160274 YANG Guozheng, YU Jing, XIAO Chuangbai, et al. Ship Wake detection in SAR images with complex background using morphological dictionary learning[J]. Acta Automatica Sinica, 2017, 43(10): 1713–1725. doi: 10.16383/j.aas.2017.c160274
[2]	李健伟, 曲长文, 彭书娟, 等. 基于生成对抗网络和线上难例挖掘的SAR图像舰船目标检测[J]. 电子与信息学报, 2019, 41(1): 143–149. doi: 10.11999/JEIT180050 LI Jianwei, QU Changwen, PENG Shujuan, et al. Ship detection in SAR images based on generative adversarial network and online hard examples mining[J]. Journal of Electronics &Information Technology, 2019, 41(1): 143–149. doi: 10.11999/JEIT180050
[3]	HOU Biao, CHEN Xingzhong, and JIAO Licheng. Multilayer CFAR detection of ship targets in very high resolution SAR images[J]. IEEE Geoscience and Remote Sensing Letters, 2015, 12(4): 811–815. doi: 10.1109/LGRS.2014.2362955
[4]	LI Jianwei, QU Changwen, and SHAO Jiaqi. Ship detection in SAR images based on an improved faster R-CNN[C]. 2017 SAR in Big Data Era: Models, Methods and Applications, Beijing, China, 2017: 1–6. doi: 10.1109/BIGSARDATA.2017.8124934.
[5]	REN Shaoqing, HE Kaiming, GIRSHICK R, et al. Faster R-CNN: Towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137–1149. doi: 10.1109/TPAMI.2016.2577031
[6]	JIAO Jiao, ZHANG Yue, SUN Hao, et al. A densely connected end-to-end neural network for multiscale and multiscene SAR ship detection[J]. IEEE Access, 2018, 6: 20881–20892. doi: 10.1109/ACCESS.2018.2825376
[7]	胡昌华, 陈辰, 何川, 等. 基于深度卷积神经网络的SAR图像舰船小目标检测[J]. 中国惯性技术学报, 2019, 27(3): 397–405, 414. doi: 10.13695/j.cnki.12-1222/o3.2019.03.018 HU Changhua, CHEN Chen, HE Chuan, et al. SAR detection for small target ship based on deep convolutional neural network[J]. Journal of Chinese Inertial Technology, 2019, 27(3): 397–405, 414. doi: 10.13695/j.cnki.12-1222/o3.2019.03.018
[8]	LIN T Y, DOLLÁR P, GIRSHICK R, et al. Feature pyramid networks for object detection[C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, USA, 2017: 936–944. doi: 10.1109/CVPR.2017.106.
[9]	CUI Zongyong, LI Qi, CAO Zongjie, et al. Dense attention pyramid networks for multi-scale ship detection in SAR images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(11): 8983–8997. doi: 10.1109/TGRS.2019.2923988
[10]	LIU Wei, ANGUELOV D, ERHAN D, et al. SSD: Single shot multibox detector[C]. The 14th European Conference on Computer Vision, Amsterdam, Netherlands, 2016: 21–37. doi: 10.1007/978-3-319-46448-0_2.
[11]	REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: Unified, real-time object detection[C]. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, USA, 2016: 779–788. doi: 10.1109/CVPR.2016.91.
[12]	SHRIVASTAVA A, GUPTA A, and GIRSHICK R. Training region-based object detectors with online hard example mining[C]. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, USA, 2016: 761–769. doi: 10.1109/CVPR.2016.89.
[13]	DUAN Kaiwen, BAI Song, XIE Lingxi, et al. CenterNet: Keypoint triplets for object detection[C]. 2019 IEEE/CVF International Conference on Computer Vision (ICCV), Seoul, South Korea, 2019: 6568–6577. doi: 10.1109/ICCV.2019.00667.
[14]	TIAN Zhi, SHEN Chunhua, CHEN Hao, et al. FCOS: Fully convolutional one-stage object detection[C]. 2019 IEEE/CVF International Conference on Computer Vision (ICCV), Seoul, South Korea, 2019: 9626–9635. doi: 10.1109/ICCV.2019.00972.
[15]	PANG Jiangmiao, CHEN Kai, SHI Jianping, et al. Libra R-CNN: Towards balanced learning for object detection[C]. 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, USA, 2019: 821–830. doi: 10.1109/CVPR.2019.00091.
[16]	CAO Yue, XU Jiarui, LIN S, et al. GCNet: Non-local networks meet squeeze-excitation networks and beyond[C]. 2019 IEEE/CVF International Conference on Computer Vision Workshop (ICCVW), Seoul, South Korea,2019: 1971–1980. doi: 10.1109/ICCVW.2019.00246.
[17]	WANG Xiaolong, GIRSHICK R, GUPTA A, et al. Non-local neural networks[C]. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, USA, 2018: 7794–7803. doi: 10.1109/CVPR.2018.00813.
[18]	HU Jie, SHEN Li, and SUN Gang. Squeeze-and-excitation networks[C]. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, USA, 2018: 7132–7141. doi: 10.1109/CVPR.2018.00745.
[19]	LI Huan and TANG Jinglei. Dairy goat image generation based on improved-self-attention generative adversarial networks[J]. IEEE Access, 2020, 8: 62448–62457. doi: 10.1109/ACCESS.2020.2981496
[20]	LIN T Y, GOYAL P, GIRSHICK R, et al. Focal loss for dense object detection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 42(2): 318–327. doi: 10.1109/TPAMI.2018.2858826
[21]	WANG Yuanyuan, WANG Chao, ZHANG Hong, et al. A SAR dataset of ship detection for deep learning under complex backgrounds[J]. Remote Sensing, 2019, 11(7): 765. doi: 10.3390/rs11070765
[22]	HUANG Lanqing, LIU Bin, LI Boying, et al. OpenSARShip: A dataset dedicated to Sentinel-1 ship interpretation[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2018, 11(1): 195–208. doi: 10.1109/JSTARS.2017.2755672
[23]	KANG Miao, JI Kefeng, LENG Xiangguang, et al. Contextual region-based convolutional neural network with multilayer fusion for SAR ship detection[J]. Remote Sensing, 2017, 9(8): 860. doi: 10.3390/rs9080860

施引文献

资源附件(0)

访问统计

图(8) / 表(4)

计量

文章访问数: 1047
HTML全文浏览量: 452
PDF下载量: 101
被引次数: 0

1. 引言
2. 系统模型
3. 基于深度学习的联合多分支合并与均衡
4. 仿真结果与分析
4.1 仿真条件
4.2 仿真结果与分析
5. 结束语

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

上下文信息融合与分支交互的SAR图像舰船无锚框检测

doi: 10.11999/JEIT201059

通讯作者:
高健康　gjk_0825@163.com

计量

An Anchor-free Method Based on Context Information Fusion and Interacting Branch for Ship Detection in SAR Images

1. 引言

2. 系统模型

3. 基于深度学习的联合多分支合并与均衡

4. 仿真结果与分析

4.1 仿真条件

4.2 仿真结果与分析

5. 结束语

计量

目录

1. 引言

2. 系统模型

3. 基于深度学习的联合多分支合并与均衡

4. 仿真结果与分析

4.1 仿真条件

4.2 仿真结果与分析

5. 结束语

留言板

上下文信息融合与分支交互的SAR图像舰船无锚框检测

doi: 10.11999/JEIT201059

通讯作者: 高健康 gjk_0825@163.com

计量

出版历程

An Anchor-free Method Based on Context Information Fusion and Interacting Branch for Ship Detection in SAR Images

1. 引言

2. 系统模型

3. 基于深度学习的联合多分支合并与均衡

4. 仿真结果与分析

4.1 仿真条件

4.2 仿真结果与分析

5. 结束语

计量

出版历程

目录

1. 引言

2. 系统模型

3. 基于深度学习的联合多分支合并与均衡

4. 仿真结果与分析

4.1 仿真条件

4.2 仿真结果与分析

5. 结束语

通讯作者:
高健康　gjk_0825@163.com