Loading [MathJax]/jax/output/HTML-CSS/jax.js
高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于深度学习的混合兴趣点推荐算法

冯浩 黄坤 李晶 高榕 刘东华 宋成芳

杨磊, 李埔丞, 李慧娟, 方澄. 稳健高效通用SAR图像稀疏特征增强算法[J]. 电子与信息学报, 2019, 41(12): 2826-2835. doi: 10.11999/JEIT190173
引用本文: 冯浩, 黄坤, 李晶, 高榕, 刘东华, 宋成芳. 基于深度学习的混合兴趣点推荐算法[J]. 电子与信息学报, 2019, 41(4): 880-887. doi: 10.11999/JEIT180458
Lei YANG, Pucheng LI, Huijuan LI, Cheng FANG. Robust and Efficient Sparse-feature Enhancementfor Generalized SAR Imagery[J]. Journal of Electronics & Information Technology, 2019, 41(12): 2826-2835. doi: 10.11999/JEIT190173
Citation: Hao FENG, Kun HUANG, Jing LI, Rong GAO, Donghua LIU, Chengfang SONG. Hybrid Point of Interest Recommendation Algorithm Based on Deep Learning[J]. Journal of Electronics & Information Technology, 2019, 41(4): 880-887. doi: 10.11999/JEIT180458

基于深度学习的混合兴趣点推荐算法

doi: 10.11999/JEIT180458
基金项目: 国家自然科学基金(41201404),中央高校基本科研业务费专项资金(2042015gf0009)
详细信息
    作者简介:

    冯浩:男,1979年生,博士,高级工程师,研究方向为体系结构和系统工程

    黄坤:男,1979年生,博士,高级工程师,研究方向为人工智能和系统工程

    李晶:男,1967年生,博士,教授,研究方向为数据挖掘和多媒体技术

    高榕:男,1981年生,博士,研究方向为数据挖掘和智能推荐

    刘东华:女,1989年生,博士生,研究方向为数据挖掘和智能推荐

    宋成芳:男,1978年生,博士,讲师,研究方向为可视化分析和位置服务

    通讯作者:

    李晶 leejingcn@163.com

  • 中图分类号: TP311

Hybrid Point of Interest Recommendation Algorithm Based on Deep Learning

Funds: The National Natural Science Foundation of China (41201404), The Fundamental Research Funds for the Central Universities of China (2042015gf0009)
  • 摘要:

    针对现有兴趣点推荐的初始化和忽视评论信息语义上下文信息的问题,将深度学习融入推荐系统中已经成为兴趣点推荐研究的热点之一。该文提出一种基于深度学习的混合兴趣点推荐模型(MFM-HNN)。该模型基于神经网络融合评论信息与用户签到信息来提高兴趣点推荐的性能。具体地,利用卷积神经网络学习评论信息的特征表示,利用降噪自动编码对用户签到信息进行初始化。进而,基于扩展的矩阵分解模型融合评论信息特征和用户签到信息的初始值进行兴趣点推荐。在真实签到数据集上进行实验,结果表明所提MFM-HNN模型相比其他先进的兴趣点推荐具有更好的推荐性能。

  • 在合成孔径雷达(Synthetic Aperture Radar, SAR)研究领域,针对特定目标的自动分类和识别一直以来都是最为热门的研究方向之一。如何稳健并高效地获取目标相关有用特征,对实现目标分类和识别至关重要。近年来,由Donoho等人[1,2]提出的压缩感知(Compressed Sensing, CS)技术,为SAR成像稀疏特征增强提供了有效的技术实现途径[3-8]。压缩感知技术可有效降低高分辨成像对系统数据采样率的要求,从而简化系统复杂度,同时降低在实际雷达系统应用中,由于功能切换、系统误差以及电子干扰等因素造成的影响,为后续目标分类识别提供便利条件。

    2007年,Baraniuk[3]首次成功应用CS理论实现高分辨SAR稀疏成像,时至今日,CS已应用于SAR[4,5]、SAR地面运动目标成像(Ground Moving Target Imaging, GMTIm)[6,7]以及逆SAR(Inverse SAR, ISAR)[8]多种模式。近十年发展中,相关稀疏特征增强成像算法可大致分为以下3类:

    (1) 贪婪(Greedy)类算法:该类算法主要通过迭代搜索均方根误差最小的局部稀疏最优解,并在解的稀疏度小于某一经验值时停止迭代。正交匹配追踪(Orthogonal Matching Pursuit, OMP)算法是最为经典的贪婪类算法之一[9],文献[4]将贪婪算法应用在宽测绘带的雷达信号处理中, 验证了此方法在成像效率上的优势。尽管该类算法计算复杂度低,运算速度快,但解的稀疏度并不高,因此针对稀疏SAR特征增强的精度有限。

    (2) 凸优化类算法:该类算法通过最小化目标的1范数,结合基追踪噪声抑制(Basis Pursuit De-Noising, BPDN),实现对稀疏信号的有效恢复。数学推导已经证明[10]1范数可认为是最优的稀疏近似解。凸优化类算法由于应用了1范数正则化模型,在稀疏信号恢复精度上明显优于贪婪算法,并在SAR领域广泛应用。文献[5]对SAR成像中的相位误差问题使用该类算法,实现了自聚焦。然而,经典的凸优化(ConVeX, CVX)主要利用了递归最小二乘的思想,在求解1范数正则化模型时每步迭代都要进行高维矩阵的求逆运算,因此存在计算效率低,对系统误差敏感等问题。

    (3) 贝叶斯类算法:该类算法基于非监督的统计机器学习理论,通过引入SAR图像目标稀疏先验分布,利用分层模型进行贝叶斯推理,从而重建稀疏特征的后验概率密度函数估计,最终获得高精度的稀疏信号恢复性能。文献[6,7]将贝叶斯压缩感知(Bayesian Compress Sensing, BCS)方法应用于SAR-GMTIm模式,得到了稀疏特征增强后的地面运动目标图像。文献[8]通过贝叶斯分层模型,实现了ISAR成像稀疏特征增强,同时对平动误差进行了统计建模从而重建目标的聚焦特征。BCS稀疏特征增强方法虽然精度较高,但是在求解过程中难以避免求逆运算,因此存在着计算复杂度大,运算效率偏低等问题。

    综上所述,有必要研究一种能在SAR稀疏特征增强中,获得精度和效率之间良好平衡的方法。2011年,Boyd等人[11]说明了交替方向多乘子方法(Alternating Direction Method of Multipliers, ADMM)可适用于大规模分布式计算系统及优化问题。这种方法最早是由Gabay和Mercier于1976年提出的,由于当时相关大规模计算系统的技术有限,所以ADMM在相当长的时间内并未得到重视。近几年随着高维大数据的出现与相关计算技术与条件的成熟,ADMM在计算效率上的优势逐渐体现出来。ADMM通过对优化变量进行对偶分解,并结合增广的拉格朗日多乘子方法建立优化方程,利用高斯-赛德尔(Gaussian-Seidel)思想进行交替方向迭代,将复杂的优化问题分解为多个简单的子优化问题,通过分解-调和(Decomposition-Coordination)方式逼近最优解。文献[11]中严格分析了ADMM的迭代残差及算法收敛性,可以保证算法在迭代运算中严格收敛,更加稳健快速地达到收敛条件,因此ADMM在SAR稀疏信号增强方面具有优异的稳健性。此方法目前已被广泛应用在图像处理领域,但是相关实验大多都局限在实数图像域,由于SAR成像回波数据的复数特性,常规的ADMM方法无法直接对复数SAR回波数据的稀疏成像。

    为了便于检验算法在目标稀疏特征增强中的性能,本文推导得出了SAR, SAR-GMTIm以及ISAR成像模式的通用回波信号解析式,并基于此应用复数ADMM(Complex ADMM, C-ADMM)的框架进行求解。C-ADMM首先对包含保真项和增广拉格朗日项的岭回归(ridge regression)问题求解,然后由1范数正则项和拉格朗日项推导复数1范数邻近算子,即复数软阈值[12],最后更新岭回归解和软阈值联合最小化的对偶变量,从而实现对复数SAR数据的稀疏特征增强。本文实验应用多种SAR模式实测数据,通过对比C-ADMM与CVX, BCS算法的稀疏成像结果,定量和定性地分析了C-ADMM在性能上的优势,验证了本文所提算法的稳健性、高效性和信号模型的通用性。

    本文提出SAR, SAR-GMTIm以及ISAR模式通用的回波信号模型,可实现多种模式回波数据的稀疏特征增强。如图1所示,图中分别给出了SAR, SAR-GMTIm以及ISAR成像的几何模型。根据合成孔径原理,3种模式的成像机理都是通过载台或者目标的运动形成虚拟合成孔径并最终实现高分辨成像。其中,SAR成像通过载机平台沿预定航线以速度v飞行,地面静止目标场景中心O与载机航线参考距离矢量为R0。为了进一步适应地面运动目标的成像需求,特采用多通道天线,以在成像处理过程中消除地面静止场景回波,即杂波的影响,从而便于检测运动目标[13]。设qi为原点到第i通道天线相位中心(Antenna Phase Center, APC)位置矢量,q0为参考通道位置矢量,如图1所示。假设地面目标位置矢量为rt(t),待成像目标与天线参考通道APC在t时刻的距离可以表示为

    图 1  SAR成像几何模型
    $$R\left( t \right) = \left| {{{r}_{\rm t}}\left( t \right) - {{q}_0}\left( t \right)} \right|$ $ (1)

    其中,t表示方位时间变量。

    (1) SAR模式

    在SAR模式下,地面成像场景静止,此时实时目标斜距可按照泰勒公式在参考斜距|R0q0(t)|处展开

    $$\begin{split} R\left( t \right) =& \left| {{{R}_0} + {{r}_p} - {{q}_0}\left( t \right)} \right|\\ =& \left| {{{R}_0} - {{q}_0}\left( t \right)} \right| + {{r}_p}\frac{{{{R}_0} - {{q}_0}\left( t \right)}}{{\left| {{{R}_0} - {{q}_0}\left( t \right)} \right|}} + o\left( t \right) \end{split}$ $ (2)

    其中,rp=(xp,rp)表示第p个地面静止散射点在方位向和距离向的位置矢量,o(t)表示在参考斜距|R0q0(t)|处的2阶及以上展开项,在高分辨小场景成像条件下高阶项的影响并不大,可以忽略。根据公式R0=R0r, q0(t)=ux,其中u=vt, rx分别表示距离向和方位向单位矢量,可以得到静止场景的SAR多点累积观测回波

    $$\begin{split}{S_0}\left( {k,t} \right) =& P\left( k \right)\sum\limits_{p = 1}^P \exp \Biggr\{ - {\rm{j}}k\Biggr( \sqrt {{R_0}^2 + {u^2}} \\ & + \frac{{{R_0}{r_p} - u{x_p}}}{{\sqrt {{R_0}^2 + {u^2}} }}\Biggr) \Biggr\} \end{split} $ $ (3)

    式(3)经过方位向dechirp操作及极坐标插值算法(Polar Formation Algorithm, PFA)[7]处理,令kr=R0k/R02+u2, kx=uk/R02+u2,可以得到回波2维波数域表达式为

    $${S_0}({k_r},{k_x}) = \sum\limits_{p = 1}^P {\exp \left( { - {\rm{j}}{k_x}{x_p} - {\rm{j}}{k_r}{r_p}} \right)} $ $ (4)

    在PFA处理中有kx=vtk0/R0,其中t表示插值后的时域变量,与kx线性相关。此时,可得SAR模式的数据域表达式为

    $$\begin{split} {S_0}(\hat r,t') &= \sum\limits_{p = 1}^P {{\rm{sinc}}\left( {\hat r - {r_p}} \right)\exp \left( { - {\rm{j}}{k_x}{x_p}} \right)} \\ &= \sum\limits_{p = 1}^P {{\rm{sinc}}\left( {\hat r - {r_p}} \right)\exp \left( {{\rm{j2}}\pi \frac{{2v{x_p}}}{{\lambda {R_0}}}t'} \right)} \end{split}$ $ (5)

    其中,回波信号可以表示为P个地面散射点回波信号的叠加求和形式,其中sinc函数为第p个散射点的距离向包络,exp函数为方位线性相位项。

    (2) SAR-GMTIm模式

    在SAR-GMTIm模式下,需要考虑地面动目标与载机平台的相对运动,平台与地面第k个运动目标的斜距历程可以写为

    $$\begin{split} R\left( t \right)\!=\! & \left| {{{R}_0} \!+ \!{{r}_k} \!+\! {{v}_k}t \!+\! \frac{1}{2}{{a}_k}{t^2} \!-\! {{q}_0}\left( t \right)} \right|\\ =& \left| {{{R}_0} \!-\! {{q}_0}\left( t \right)} \right| \!+\! \left( {{{r}_k} \!+\! {v}_k^{}t \!+\! \frac{1}{2}{{a}_k}{t^2}} \right)\frac{{{{R}_0} \!-\! {{q}_0}\left( t \right)}}{{\left| {{{R}_0} \!-\! {{q}_0}\left( t \right)} \right|}} \\ &+ \frac{{{{\left( {{{r}_k} + {{v}_k}t + \frac{1}{2}{{a}_k}{t^2}} \right)}^2}}}{{2\left| {{{R}_0} - {{q}_0}\left( t \right)} \right|}} + o\left( t \right)\\[-15pt] \end{split}$ $ (6)

    其中,rk,vkak分别为目标的初始位置、速度和加速度矢量,可分解为

    $$\left. \begin{array}{l} {{r}_k} = x_k^{}{x} + r_k^{}{r}\\ {{v}_k} = v_k^x{x} + v_k^r{r}\\ {{a}_k} = a_k^x{x} + a_k^r{r} \end{array} \right\}$ $ (7)

    由于本文GMTIm模式采用沿航向多通道SAR体制,根据通道间地面静止目标回波(杂波)的方位不变性,可实现杂波抑制,从而有效提高对运动目标成像的信噪比。式(7)经过对每个通道的SAR回波进行成像处理,再利用DPCA方法[14],将任意通道与参考通道进行相消,便可以得到杂波抑制后总回波为

    $$ \begin{split} {S_{i {\scriptsize{-}} 0}}\left( {\hat r,t'} \right) =& \sum\limits_{k = 1}^K {{A_k}} {\rm{sinc}}\left( {\hat r - {r_k}} \right)\exp \left( {{\rm{j}}\frac{{\psi _i^{}}}{{\rm{2}}}} \right)\\ &\cdot\exp \left( {{\rm{j}}2\pi f_d^kt' + {\rm{j}}\pi \gamma _d^k{t^{'2}}} \right) + {\rm{C}}{{\rm{N}}_{i - 0}}\left( {\hat r,t'} \right) \end{split}$ $ (8)

    其中,Si0(ˆr,t)可以分解为由地面静止目标产生的残留杂波CNi0(ˆr,t)与其余由K个观测目标产生的运动回波之和,第k个运动目标的回波可以表示为距离向包络sinc函数与运动引起的方位向的线性相位乘积的形式,其中ψi=(4π/λ0)(vr/v)di表示干涉相位,diqiq0通道之间的距离。λ0表示工作波长,其中fkdγkd分别为目标运动造成的方位多普勒频率和调频率,即

    $$\left. {\begin{array}{*{20}{l}} {f_d^k \!=\! \dfrac{{2v}}{{{\lambda _0}}}\dfrac{{{x_k}}}{{{R_0}}} \!-\! \dfrac{2}{{{\lambda _0}}}\dfrac{{\left( {{R_0} + {r_k}} \right)v_k^r}}{{{R_0}}}}\\ {\gamma _d^k \!=\! \dfrac{2}{{{\lambda _0}}}\dfrac{{{v^2}}}{{{R_0}}} \!-\! \dfrac{2}{{{\lambda _0}}}\dfrac{{{{\left( {v - v_k^x} \right)}^2}}}{{{R_0}}} \!-\! \dfrac{2}{{{\lambda _0}}}\dfrac{{\left( {{R_0} \!+\! {r_k}} \right)a_k^r}}{{{R_0}}}} \end{array}} \right\}$ $ (9)

    其中,多普勒频率和调频率可通过吕氏分布(LVs Distribution, LVD)时频表示方法进行估计[15]

    (3) ISAR模式

    合成孔径概念可以推广至空中运动目标成像中,ISAR成像几何模型如图1(b)所示,经过补偿平动误差分量后[16],目标可等效为转台模型,并以均匀角速度ω转动。在小转角假设下,目标在相干积累时间内的转角θ(t)0,可得目标散射点与雷达距离历程为

    $$\begin{split}R\left( t \right) =& {R_0} + {r_p}\cos \theta \left( t \right) + {x_p}\sin \theta \left( t \right) \\ \approx & {R_0} + {r_p} + {x_p}\omega t\end{split}$ $ (10)

    此时与SAR模式的处理流程相同,可得到回波

    $$\begin{split} S(\hat r,t) =& \sum\limits_{p = 1}^P {{\rm{sinc}}\left( {\hat r - {r_p}} \right)\exp \left( { - {\rm{j}}k{x_p}\omega t} \right)} \\ \approx &\sum\limits_{p = 1}^P {{\rm{sinc}}\left( {\hat r - {r_p}} \right)\exp \left( {{\rm{j2\pi }}\frac{{2{x_p}\omega }}{\lambda }t} \right)}\end{split} $ $ (11)

    由式(11)可见,ISAR与SAR模式类似,相应回波也可表示为距离向sinc包络与方位向线性相位乘积的P点累积求和的形式。

    综上所述,多种SAR成像模式的距离压缩域数据S(ˆr,t)S(ˆr,t),均可表示为距离向sinc包络与方位向线性相位乘积,并进行多点累积求和的形式,因此SAR回波成像类似于线性回归模型

    $${Y} = {AX} + {{C}}_{\rm{N}}$ $ (12)

    其中,Y表示距离压缩预处理后的SAR数据,即推导得出的S(ˆr,t)S(ˆr,t), X为待恢复的目标或图像,相应像素对应了方位向和距离向位置,CN为加性的噪声、杂波和干扰等,A为方位向傅里叶字典,根据上述讨论字典A可表示为

    $$\left. {\begin{array}{*{20}{l}} {{A} \!=\! {A}\left( {{{\gamma }_d}} \right) = \left[ {{{A}_1},{{A}_2}, ··· ,{{A}_k}} \right]}\\ {{{A}_k} \!=\! {{A}_0} \odot {B}\left( {{\gamma _d}^k} \right)}\\ {{{A}_0} \!=\! \left[ {{a}\left( {{f_d}\left( 1 \right)} \right),{a}\left( {{f_d}\left( 2 \right)} \right), ··· ,{a}\left( {{f_d}\left( n \right)} \right)} \right]}\\ {a}\left( {{f_d}\left( n \right)} \right) = \left[ {{\rm{e}}^{ - {\rm{j}}2{\rm{\pi }}{f_d}\left( n \right){t_1}}},\right.\\ \left.{{\rm{e}}^{ - {\rm{j}}2{\rm{\pi }}{f_d}\left( n \right){t_2}}}, ··· ,{{\rm{e}}^{ - {\rm{j}}2{\rm{\pi }}{f_d}\left( n \right){t_n}}} \right]^{\rm{T}}\\ {{B}\left( {{\gamma _d}^k} \right) \!=\! {{\left[ {{b}\left( {{\gamma _d}^k} \right),{b}\left( {{\gamma _d}^k} \right), ··· ,{b}\left( {{\gamma _d}^k} \right)} \right]}_{1 \times N}}}\\ {{b}\left( {{\gamma _d}^k} \right) \!=\! {{\left[ {{{\rm{e}}^{{\rm{j\pi }}{\gamma _d}^k{t_1}^2}},{{\rm{e}}^{{\rm{j\pi }}{\gamma _d}^k{t_2}^2}}, ··· ,{{\rm{e}}^{{\rm{j\pi }}{\gamma _d}^k{t_N}^2}}} \right]}^{\rm{T}}}} \end{array}}\!\!\! \right\}\!\!\!\!\!\!$ $ (13)

    其中,[]T表示矩阵转置操作符,为Hadamard积操作符。在SAR和ISAR成像模式下,A为常规的傅里叶字典,即A=A0,在GMTIm的成像模式下,A为2阶参数化傅里叶字典,即A=A(γd)

    由于观测回波噪声的影响,直接求解如式(12)所示的SAR成像通用回波模型,如X=A1Y,将出现严重的误差,[]1 表示矩阵求逆运算。因此Tibshirani[17]在1996年提出了最小绝对收缩和变量选择算子(the Least Absolute Shrinkage and Selection Operator, LASSO)模型,在原来只有保真项的基础上增加了1范数正则项,更有利于选择理想的解,LASSO模型为

    $$\hat{ X} = \arg \mathop {\min }\limits_{{X}} \left( {\frac{1}{2}\left\| {{Y} - {AX}} \right\|_{\rm{F}}^2{\rm{ + }}\lambda {{\left\| {X} \right\|}_1}} \right)$ $ (14)

    其中,1F分别表示1范数和Fibonacci范数,λ为正则项系数,通常λ>0。式(14)中第1项为保真项,表示恢复后雷达图像和原始图像的逼近程度,第2项为正则项,表征了SAR图像中强散射点具有的稀疏先验信息。通过调整参数λ可调节稀疏解的稀疏度,同时达到较好的抑噪性能。Boyd等人[11]在2012年较为系统地提出了基于ADMM方法求解LASSO问题的操作步骤,同时结合了对偶分解和增广的拉格朗日多乘子方法,将优化问题分步进行求解,从而在提高计算效率的同时获得稳健的收敛性能。ADMM方法的优势在于将一个复杂的优化问题分解为若干个子问题,在实现分布式优化的同时可以调和全局性能,从而达到对最优解的逼近。依据ADMM算法理论,LASSO可以分解为两个子问题f(X)=(1/2)YAX2Fg(Z)=λZ1,此时,式(14)的优化问题可以等效表示为

    $${\rm{minimize}}\;f\left( {X} \right) + g\left( {Z} \right),\quad {\rm{s}}.{\rm{t}}.\;{X} - {Z} = 0$ $ (15)

    由此,建立带有增广拉格朗日项的优化方程,如

    $$ \begin{split} {{{L}}_\rho }\left( {{X},{Z},{U}} \right){\rm{ = }}&f\left( {X} \right){\rm{ + }}g\left( {Z} \right){\rm{ + }}{{U}^{\rm{H}}}\left( {{X} - {Z}} \right)\\ &{\rm{ + }}\left( {\rho /2} \right)\left\| {{X} - {Z}} \right\|_{\rm{F}}^2\end{split}$ $ (16)

    其中,[]H表示矩阵共轭转置操作符,ρ为拉格朗日乘子系数,引入的拉格朗日乘子项为优化方程式(17)加上了等式约束,将目标解限定在相应的可行域之内,提升了求解效率,即算法的稳健性。此时,求得ADMM的解可表示为

    $$ \!\!\!\left. {\begin{array}{*{20}{l}} {{{X}^{k \!+\! 1}} \!= \!{\rm{arg}}\mathop {{\rm{min}}}\limits_{{X}} \left\{ {f\left( {X} \right) \!+\! \dfrac{\rho }{2}\left\| {{X} \!-\! {{Z}^k} \!+\! {{U}^k}} \right\|_{\rm{F}}^2} \right\}}\\ {{{Z}^{k \!+\! 1}} \!=\! {\rm{arg}}\mathop {{\rm{min}}}\limits_{{Z}} \left\{ {g\left( {Z} \right) \!+\! \dfrac{\rho }{2}\left\| {{{X}^{k \!+\! 1}} \!-\! {Z} \!+\! {{U}^k}} \right\|_{\rm{F}}^2} \right\}}\\ {{{U}^{k \!+\! 1}} \!=\! {{U}^k} \!+\! {{X}^{k + 1}} \!-\! {{Z}^{k \!+\! 1}}} \end{array}} \!\!\!\!\right\}\!\!$ $ (17)

    其中,上标k表示矩阵第k次迭代值。变量XZ通过交替方向的迭代更新可达到联合最小化,而变量U则利用了XZ的迭代值获得对偶变量更新,在求解过程中,拉格朗日乘子分别作用于变量XZ,然后通过XZ的迭代间接作用于变量U,从而提高了收敛速率与稳健性。下面分别针对式(17)的3个步骤说明如下:

    步骤 1 岭回归 由式(17)中第1个等式,变量X的优化问题等同于保真项与拉格朗日项两个Fibonacci范数的联合最小化问题,该最小化问题可理解为岭回归问题,即

    $$\begin{split}{{X}^{k + 1}}=&{\rm{ arg}}\mathop {{\rm{min}}}\limits_{{X}} \left\{ \frac{1}{2}{\rm{Tr}}\left[ {{{\left( {{Y} - {AX}} \right)}^{\rm{H}}}\left( {{Y} - {AX}} \right)} \right] \right.\\ & + \frac{\rho }{2}{\rm{Tr}}\left[ {{{\left( {{X} - {{Z}^k} + {{U}^k}} \right)}^{\rm{H}}}\left( {{X} - {{Z}^k} + {{U}^k}} \right)} \right] \} \end{split}$ $ (18)

    其中Tr[]表示求迹运算符。由式(18)可见,最小化目标函数为凸函数,因此最优值可通过对目标函数求导得到,解得

    $${{X}^{k + 1}} \!=\! {\left( {{{A}^{\rm{H}}}{A} \!+\! \rho {I}} \right)^{ - 1}}\left\{ {{{A}^{\rm{H}}}{Y} \!+\! \rho \left( {{{Z}^k} \!-\! {{U}^k}} \right)} \right\}$ $ (19)

    步骤 2 1范数正则化 再由式(17),变量Z的优化问题可表示求解1范数正则化问题,区别于式(14)的LASSO问题,这里的正则化面向的是增广的拉格朗日项。由1范数正则化,可实现对成像场景稀疏特征的先验表征,利用式(18)求解X中的梯度下降思想,得

    $$\begin{split} {{Z}^{k + 1}} &\!=\! {\rm{arg}}\mathop {{\rm{min}}}\limits_{{Z}} \left\{ {\lambda {{\left\| {Z} \right\|}_1} \!+\! \left( {\rho /2} \right)\left\| {{{X}^{k \!+\! 1}} \!-\! {Z} \!+\! {{U}^k}} \right\|_{\rm{F}}^2} \right\}\\ & = {S_{\lambda /\rho }}\left( {{{X}^{k + 1}} + {{U}^k}} \right)\\[-12pt] \end{split} $ $ (20)

    其中,Sλ/ρ(x)表示x的软阈值(soft thresholding)算子[12]xX中的任意元素,当X属于实数域时,有

    $$\begin{split}{{\rm{S}}_{\lambda /\rho }}\left( {{{X}^{k + 1}} + {{U}^k}} \right) =& {\rm{sign}}\left( {{{X}^{k + 1}} + {{U}^k}} \right){\kern 1pt} \\ &\cdot \max \left( {\left| {{{X}^{k + 1}} + {{U}^k}} \right| - \lambda /\rho ,0} \right)\end{split}$ $ (21)

    其中,sign(x)max(x)分别代表x的符号函数与求最大值函数,实数xR的软阈值算子Sλ/ρ(xR)示意图如图2所示。图2中,实数软阈值可以看作一个分段线性滤波器,对|x|(λ/ρ)的较小值进行归零操作,当|x|>(λ/ρ)时,对x进行线性缩小。本文针对SAR回波的复数特性,改进现有实数软阈值算子,将复数矩阵Z中的任意元素z拆解为实数部分RE(z)和虚数部分IM(z),并对X,U进行同样复数分解,通过式(20)中的上式对RE(z)IM(z)分别求导,得到复数软阈值算子,如

    图 2  实数软阈值算子示意图
    $$\begin{split}{{Z}^{k + 1}} =& {{\rm{S}}_{\lambda /\rho }}\left( {{{X}^{k + 1}} + {{U}^k}} \right)\\ {\rm{ = }}&\left( {{{X}^{k + 1}} + {{U}^k}} \right)/\left| {{{X}^{k + 1}} + {{U}^k}} \right| \\ &\cdot \max (\left| {{{X}^{k + 1}} + {{U}^k}} \right| - \lambda ,0)\end{split}$ $ (22)

    由式(22)可知,复数软阈值与实数软阈值一样具有保相性。此处为了表示方便,绘制复数xC软阈值算子Sλ/ρ(xC)图3

    图 3  复数软阈值算子示意图

    图3中,复数x的幅度为|x|,幅角为x[0,2π),对应的复数软阈值Sλ/ρ(x)的幅角也为x,所以由|x|x足以表示所有复数x的取值范围, 在平行于纸面的笛卡尔坐标系上画出|x|Sλ/ρ(x)的对应关系也并不困难,然后将坐标系以Sλ/ρ(x)轴沿纸面纵旋转整个幅角x的取值范围,便描绘出了复数域中xSλ/ρ(x)的一一对应关系,实数软阈值也可以看做x=0时复数软阈值的一个特例。

    由于复数软阈值比实数软阈值更具有普适性,尤其适用于复数SAR回波数据的稀疏特征增强处理,基于此,本文提出利用复数软阈值的C-ADMM算法。

    步骤 3 对偶变量更新 XZ的更新是对其联合取值最小化的过程,在C-ADMM算法中,U的迭代也就对XZ联合对偶变量的更新过程,即

    $${{U}^{k + 1}} = {{U}^k} + {{X}^{k + 1}} - {{Z}^{k + 1}}$ $ (23)

    式(19)、式(22)和式(23)给出了C-ADMM更新过程的解析形式,利用高斯-赛德尔思想循环迭代,直到满足停止准则,即达到设定的迭代次数或者精度RkFε,此处Rk=XkZk表示主残差,ε为依据经验设定的精度阈值,当满足停止准则时算法终止。

    综上所述,可提出基于C-ADMM的SAR稀疏特征增强成像算法流程,如表1所示。

    表 1  C-ADMM稀疏特征增强算法流程
    (1) 初始化,输入SAR原始数据;
    (2) 信号预处理,得到通用信号模型S(ˆr,t)S(ˆr,t)
    (3) 设定初值X0=Z0=U0=0,构造字典A=A0A(γd)
    (4) 设定迭代次数与目标精度,若停止准则不满足,进行循环;
    (5) 更新目标图像
      Xk+1=(AHA+ρI)1{AHY+ρ(ZkUk)};
    (6) 更新软阈值Zk+1=Sλ/ρ(Xk+1+Uk);
    (7) 更新对偶变量Uk+1=Uk+Xk+1Zk+1;
    (8) 若不满足停止准则,继续步骤5—步骤7,若满足停止准则,跳 出循环;
    (9) 输出稀疏特征增强后的图像。
    下载: 导出CSV 
    | 显示表格

    本文在C-ADMM稀疏特征增强算法中,引入增广拉格朗日乘子,进而在每次迭代中应用其作为可行的边界约束,提升了算法的稳健性;通过对偶分解与交替方向迭代,提高了算法的运算效率;利用复数软阈值,增加了针对SAR数据的实用性。

    为了验证所提的C-ADMM算法与信号模型的有效性和通用性,本节利用复数仿真实验对C-ADMM在不同信噪比和降采样情况下的稀疏恢复性能进行验证,然后使用SAR, SAR-GMTIm和ISAR 3种模式的实测数据进行实验,并与BCS和CVX成像结果进行对比,从而验证C-ADMM稀疏特征增强算法的稳健性和高效性。

    为了定量直观的衡量C-ADMM算法的稀疏恢复性能,本节实验借鉴了Donoho等人[18]提出的相变图(Phase Transition Diagram, PTD)进行验证。PTD的横坐标为降采样率,纵坐标为稀疏度,图中的每个点代表了长度为1024的原始复数序列在对应降采样率和稀疏度的情况下,通过100组蒙特卡洛实验恢复的成功概率,图中不同颜色表示了平均恢复的成功概率,恢复成功与失败主要通过归一化均方误差(Normalized Mean Square Error, NMSE)进行表征,其表达式为

    $${\rm{NMSE}}\; = \;\left\| {\left( {{{X}^k} - {X}} \right)/{X}} \right\|_{\rm{F}}^2$ $ (24)

    当NMSE< 0.0001时定义为恢复成功,实验分别对无噪声信号和信噪比为10 dB的噪声信号进行恢复,结果如图4

    图 4  C-ADMM在无噪声和10 db信噪比情况下的相变图

    图4(a)中可以看出,当无噪声时,C-ADMM在较低稀疏度和降采样率的情况下,都能完好恢复原始信号,因此能恢复的区域面积饱满,在稀疏度较大降采样率较低的情况下,即采样率太低以至于无法在采样中保留所有的序列信息,因此难以恢复信号,对应的区域恢复概率接近于0,换言之,原始信号并不具有稀疏性。图4(b)中当加入噪声使信噪比为10 dB时,可以看出能恢复的区域变小,说明加入的噪声影响了部分信号以至于难以恢复,但是当稀疏度较小时仍有大面积的能恢复区域,说明在信号足够稀疏的条件下,C-ADMM仍然具有优异的恢复性能。

    传统SAR稀疏特征增强算法运算效率较低[19,20],难以适应实际SAR成像应用中较大的成像场景区域和回波数据量。本节应用所提C-ADMM稀疏特征增强算法进行实验验证,实验选用美国Sandia实验室公布的实测SAR复图像数据。该数据应用Ka波段雷达获取,成像分辨率达0.1 m。

    图5为应用距离多普勒(Range Doppler, RD)传统算法直接成像与本文中C-ADMM算法成像结果对比,用于参考的RD成像结果背景噪声明显,影响了地面虚线状场景的成像对比度,而C-ADMM成像结果中的强散射点明显被增强,背景噪声受到抑制,地物特征轮廓清晰,虚线部分易于辨别,验证了C-ADMM算法对SAR成像模式稀疏特征增强效果。

    图 5  SAR大图C-ADMM稀疏特征增强成像结果

    为了进一步评估C-ADMM算法的运算效率和细节表现,图6中实验截取图5部分数据使用C-ADMM与BCS,CVX算法进行成像。如图6(b)所示。应用C-ADMM算法进行稀疏特征增强的细节效果最佳,相比图6(a)用于参考的RD成像结果,背景噪声受到了抑制,稀疏特征得以增强,BCS和CVX算法虽然起到了一定程度的稀疏特征增强效果,但都残留了部分噪声,影响观测结果,C-ADMM成像结果中的虚线目标边界清晰,并且运算效率最高,运算时间t仅需5.17 s,相比BCS (t=1481.10 s)和CVX (t=23193.92 s)算法的运算效率提高了2~3个数量级(至少100倍以上)。

    图 6  SAR局部C-ADMM稀疏特征增强成像结果

    但是由于SAR模式成像区域大,散射特征复杂,不同场景的散射点强度与数量不尽相同,仅调节正则化参数只会抑制弱散射点,保留强散射点,对散射特性不均匀的成像目标很难保证其内部连续性,如图6中C-ADMM在增强稀疏特征的同时,也对线目标的连续性产生了影响,因此在增强稀疏特征的同时,如何有效地保留并增强其他特征,笔者正在探索。

    为了验证所提C-ADMM对于地面运动目标的成像性能,本组实验应用美国空军实验室公开的实测Gotcha雷达数据。该数据采用三通道SAR体制,X波段,因此可以初步实现针对地面杂波的抑制效果,成像最高分辨率可达0.3 m。图7(a)所示为两个地面运动目标直接SAR成像结果,由于目标运动,造成成像结果中目标出现严重散焦。本文采用LVD时频表示并构造字典A后,分别应用C-ADMM, BCS和CVX进行稀疏特征增强结果如图7(b)图7(d)所示。对比实验结果可见,C-ADMM和BCS的稀疏特征增强效果较好,目标聚焦性能和图像对比度提升明显。并且C-ADMM计算效率更高(t=5.88 s),运算耗时明显优于BCS(t=672.12 s)和CVX (t=8657.45 s)。实验结果证明,本文所提C-ADMM稀疏特征增强算法精度完全可以比拟高精度的贝叶斯类算法,在运算效率上相比传统方法至少提升2~3个数量级。

    图 7  GMTI 模式C-ADMM稀疏特征增强成像结果

    为了验证信号模型的通用性与C-ADMM算法优势,本组实验使用通过ISAR成像的Yak32的实测数据,ISAR模式一般杂波较少,并且,为了进一步验证C-ADMM的稳健性,本文对数据进行了模拟降采样和加入不同噪声,并用3种方法进行了信号稀疏特征增强,结果如图8图9

    图 8  ISAR模式C-ADMM不同降采样成像结果
    图 9  ISAR模式C-ADMM不同信噪比成像结果

    图8在实验数据中均加入了5 dB噪声,从上到下依次为未降采样后的图像、降采样率为0.5和0.25的图像,从左到右依次为RD, C-ADMM, BCS, CVX处理的结果。从RD成像结果图8(a)图8(e)图8(i)看出,降采样率越低,成像时产生的噪声越大,恢复的图像效果越差,飞机轮廓难以识别。其它3种算法成像结果都对噪声进行了抑制,其中在同样降采样情况下(降采样0.5),C-ADMM和BCS的稀疏特征增强效果最好,背景噪声最为干净,目标飞机轮廓清晰,其中,在处理时间t上C-ADMM更为高效(t=0.41 s),比BCS (t=93.88 s)和CVX (t=528.55 s)快了至少2个数量级。

    图9对实验数据均进行了0.5倍降采样,从上到下的信噪比情况依次为5 dB, 0 dB, –2 dB,在参考的 RD算法结果中,随着加入噪声越来越大,成像目标难以辨识,直至淹没在噪声中。从图中可以看出,C-ADMM等3种都产生了稀疏特征增强效果,当噪声较大时,BCS在部分距离单元上的噪声没有抑制效果,而CVX成像结果丢失了目标的部分轮廓,C-ADMM的稀疏效果最好,完好的保留了目标的轮廓,并抑制了背景噪声,在处理时间t上,C-ADMM相比BCS和CVX快了90倍以上。

    在以上3组实验中,由于SAR与GMTI模式强散射点,成像场景噪声情况复杂,可以使用C-ADMM算法在成像处理的同时,对成像目标的稀疏特征进行增强,而ISAR模式中成像目标相对于背景本身就具有强稀疏性,因此可以使用C-ADMM算法进行稀疏信号恢复,多种噪声与降采样情况的恢复结果都直观地反映了C-ADMM算法的稳健性。在成像过程中,CVX算法利用递归最小二乘思想迭代求解,而BCS每次迭代必须进行求逆运算,这导致了CVX和BCS方法的求解效率并不高,C-ADMM结合对偶思想并引入拉格朗日乘子,求解效率更高,相比BCS和CVX,在处理效率上节省了近百倍的时间,说明C-ADMM在SAR稀疏特征增强中更为高效。

    本文针对SAR, GMTIm和ISAR 3种成像模式,推导获得了通用的回波信号模型,同时提出了面向复数回波数据的C-ADMM稀疏特征增强算法,可实现目标稀疏特征的稳健高效恢复。本文实验应用多组数据进行验证,同时对比传统CVX和BCS稀疏特征增强方法,证明了本文所提C-ADMM算法的有效性和优越性。然而,在实验过程中,本文发现单一增强稀疏特征对目标成像精度的提升帮助有限,有必要研究适用于更多特征的增强方法,这将是后续工作的重点。

  • 图  1  基于混合神经网络矩阵分解的兴趣点推荐模型

    图  2  MFM-HNN模型基于LA数据集和NYC数据集与其他4个模型的推荐性能对比

    图  3  基于LA和NYC数据集的5个初始化方法的性能对比

    图  4  MFM-HNN模型基于LA数据集和NYC数据集在不同层数的性能对比

    表  1  MFM-HNN模型学习算法

     输入:xi,Su,Sv,˜Su,˜Sv,T,B
     输出:L
     (1) For t<T Do
     (2) 从兴趣点评论中随机选取一个兴趣点的评论矩阵xi进行训练,   训练批次大小为β0,每一个批次的大小为B,计算训练过程   中的损失Lcnn
     (3) if t>T or Lcnn足够小
     (4) end
     (5) for t<T Do
     (6) 从兴趣点评分中随机选取一个兴趣点的用户-兴趣点对(˜sui,˜svi)   进行训练,训练批次大小为β1,每一个批次的大小为B,计算    训练过程中的损失Lui
     (7) if t>T or Lui足够小
     (8) end
     (9) 计算最终的损失值L=Lcnn+Lui
     (10) return L
    下载: 导出CSV

    表  2  数据集统计

    数据统计LANYC
    用户数量30,20847,240
    兴趣点数量142,798203,765
    签到数量(评论)244,861388,954
    用户-位置矩阵密度5.68×10–54.04×10–5
    下载: 导出CSV
  • LI Jun, BENEDIKTSSON J A, ZHANG Bing, et al. Spatial technology and social media in remote sensing: A survey[J]. Proceedings of the IEEE, 2017, 105(10): 1855–1864 doi: 10.1109/JPROC.2017.2729890
    YANG, C, BAI Lanxiao, ZHANG Chao, et al. Bridging collaborative filtering and semi-supervised learning: A neural approach for POI recommendation[C]. Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Halifax, Canada, 2017: 1245–1254.
    LIU Yiding, PHAM T A N, CONG Gao, et al. An experimental evaluation of point-of-interest recommendation in location-based social networks[J]. Proceedings of the VLDB Endowment, 2017, 10(10): 1010–1021 doi: 10.14778/3115404.3115407
    MAZUMDAR P, PATRA B K, BABU K S, et al. Hidden location prediction using check-in patterns in location-based social networks[J]. Knowledge and Information Systems, 2017, 57(3): 571–601 doi: 10.1007/s10115-018-1170-5
    余永红, 高阳, 王皓. 基于Ranking的泊松矩阵分解兴趣点推荐算法[J]. 计算机研究与发展, 2016, 53(8): 1651–1663 doi: 10.7544/issn1000-1239.2016.20160202

    YU Yonghong, GAO Yang, and WANG Hao. A ranking based Poisson matrix factorization model for point-of-interest recommendation[J]. Journal of Computer Research and Development, 2016, 53(8): 1651–1663 doi: 10.7544/issn1000-1239.2016.20160202
    LIM K H, CHAN J, LECKIE C, et al. Personalized trip recommendation for tourists based on user interests, points of interest visit durations and visit recency[J]. Knowledge and Information Systems, 2018, 54(2): 375–406 doi: 10.1007/s10115-017-1056-y
    YIN Hongzhi, SUN Yizhou, CUI Bin, et al. LCARS: A location-content-aware recommender system[C]. Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Chicago, USA, 2013: 221–229.
    ZHANG Jiadong, CHOW Chiyin, and ZHENG Yu. ORec: An opinion-based point-of-interest recommendation framework[C]. Proceedings of the 24th ACM International on Conference on Information and Knowledge Management, Melbourne, Australia, 2015: 1641–1650.
    WANG Hao, WANG Naiyan, and YEUNG D Y. Collaborative deep learning for recommender systems[C]. Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Sydney, Australia, 2015: 1235–1244.
    KIM D, PARK C, OH J, et al. Convolutional matrix factorization for document context-aware recommendation[C]. Proceedings of the 10th ACM Conference on Recommender Systems, Boston, USA, 2016: 233–240.
    DONG Xing, YU Lei, WU Zhonghuo, et al. A hybrid collaborative filtering model with deep structure for recommender systems[C]. Proceedings of the 31st AAAI Conference on Artificial Intelligence, San Francisco, USA, 2017: 1309–1315.
    任星怡, 宋美娜, 宋俊德. 基于位置社交网络的上下文感知的兴趣点推荐[J]. 计算机学报, 2017, 40(4): 824–841 doi: 10.11897/SP.J.1016.2017.00824

    REN Xingyi, SONG Meina, and SONG Junde. Context-aware point-of-interest recommendation in location-based social networks[J]. Chinese Journal of Computer, 2017, 40(4): 824–841 doi: 10.11897/SP.J.1016.2017.00824
    GAO Rong, LI Jing, LI Xuefei, et al. A personalized point-of-interest recommendation model via fusion of geo-social information[J]. Neurocomputing, 2018, 273: 159–170 doi: 10.1016/j.neucom.2017.08.020
    LIAN Defu, ZHENG Kai, GE Yong, et al. GeoMF++: Scalable location recommendation via joint geographical modeling and matrix factorization[J]. ACM Transactions on Information Systems, 2018, 36(3): 33 doi: 10.1145/3182166
    ZDUNEK R. Initialization of nonnegative matrix factorization with vertices of convex polytope[C]. Proceedings of the 11st International Conference on Artificial Intelligence and Soft Computing, Zakopane, Poland, 2012: 448–455.
    YANG Cheng, SUN Maosong, ZHAO W X, et al. A neural network approach to jointly modeling social networks and mobile trajectories[J]. ACM Transactions on Information Systems, 2017, 35(4): 36 doi: 10.1145/3041658
    DENG Shuiguang, HUANG Longtao, XU Guangdong, et al. On deep learning for trust-aware recommendations in social networks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2017, 28(5): 1164–1177 doi: 10.1109/TNNLS.2016.2514368
    GAO Huiji, TANG Jiliang, HU Xia, et al. Content-aware point of interest recommendation on location-based social networks[C]. Proceedings of the 29th AAAI Conference on Artificial Intelligence, Austin, Texas, 2015: 1721–1727.
    ZHANG Fuzheng, YUAN N J, ZHENG Kai, et al. Exploiting dining preference for restaurant recommendation[C]. Proceedings of the 25th International Conference on World Wide Web, Montréal, Canada, 2016: 725–735.
    LIU Yong, WEI Wei, SUN Aixin, et al. Exploiting geographical neighborhood characteristics for location recommendation[C]. Proceedings of the 23rd ACM International Conference on Information and Knowledge Management, Shanghai, China, 2014: 739–748.
    LI Huayu, GE Yong, HONG Richang, et al. Point-of-interest recommendations: Learning potential check-ins from friends[C]. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco, USA, 2016: 975–984.
    ORCHAND M. Least square quantization in PCM[J]. IEEE Transaction on Information Theory, 1982, 28(2): 129–137 doi: 10.1109/TIT.1982.1056489
    SHI J and MALIK J. Normalized cuts and image segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22(8): 888–905 doi: 10.1109/34.868688
  • 期刊类型引用(3)

    1. 王鹏一,张仁秀,张宪超,张伟,马瑾. 基于5G+雾计算的智慧城市模型研究. 电信工程技术与标准化. 2024(04): 43-46 . 百度学术
    2. 尹光銮. 基于云雾混合计算的智能灌溉系统设计. 电子技术. 2024(11): 72-73 . 百度学术
    3. 杨守义,韩昊锦,郝万明,陈怡航. 边缘计算中面向缓存的迁移决策和资源分配. 电子与信息学报. 2024(12): 4391-4398 . 本站查看

    其他类型引用(1)

  • 加载中
图(4) / 表(2)
计量
  • 文章访问数:  3623
  • HTML全文浏览量:  1718
  • PDF下载量:  203
  • 被引次数: 4
出版历程
  • 收稿日期:  2018-05-14
  • 修回日期:  2018-11-26
  • 网络出版日期:  2018-12-05
  • 刊出日期:  2019-04-01

目录

/

返回文章
返回