A Kernel Normalization Decorrelated Affine Projection P-norm Algorithm Based on Gaussian Kernel Explicit Mapping
-
摘要:
为了降低核仿射投影P范数(KAPP)算法的计算量和存储容量,提高在输入信号强相关时KAPP算法的收敛速度和稳态性能,该文提出基于高斯核显性映射的核归一化解相关APP(KNDAPP-GKEM)算法。该算法利用归一化解相关方法预先解除输入信号的相关性;利用高斯核显式映射方法近似得到显式核函数,消除了对历史数据的依赖,解决了KAPP算法因结构不断生长导致的计算量和存储容量过大的问题。α稳定分布噪声背景下的非线性系统辨识仿真结果表明,在输入信号强相关时KNDAPP-GKEM算法收敛速度快,非线性系统辨识稳态均方误差小,训练所需时间呈线性缓慢增长,有利于实际非线性系统辨识的应用。
Abstract:In order to reduce the computation complexity and storage capacity of the Kernel Affine Projection P-norm (KAPP) algorithm, and improve the convergence rate and steady-state performance of the algorithm when the input signal is strongly correlated, a Kernel Normalization Decorrelated Affine Projection P-norm algorithm based on Gaussian Kernel Explicit Mapping (KNDAPP-GKEM) is proposed. The correlation of the input signal is eliminated in advance by the normalized correlation method. The explicit kernel function is approximated by Gaussian kernel explicit mapping method, which eliminates the dependence on historical data and solves the problem that the computation and storage capacity of the KAPP algorithm are too high due to the continuous growth of structure. The simulation results of nonlinear system identification under α-stable distribution noise environment show that when the training data scale is large, the KNDAPP-GKEM algorithm still maintains a fast convergence rate and the low identification mean square error of nonlinear system. Moreover, its training time is linearly and slowly increased, which is more conducive to the practical application of nonlinear system identification.
-
1. 引言
仿射投影(Affine Projection, AP)算法[1]是一种复杂度介于经典最小均方算法和递归最小二乘(Recursive Least Square, RLS)算法之间、收敛性能接近于RLS的自适应滤波算法,其在语音信号处理、自适应回声消除等领域得到广泛应用。AP算法通过重复利用过去多个时刻的输入信号和误差信号减小随机梯度噪声,从而有效提高算法的估计精度和收敛性能。为了进一步提高AP算法的收敛性能,文献[2]提出了基于q梯度的AP算法。为了提高AP算法对相关信号的自适应处理性能,文献[3]提出了解相关仿射投影(Decorrelated Affine Projection, DAP)算法,该算法对输入矩阵进行预处理,解除不同时刻输入矩阵的相关性,提高了算法的收敛速度。为了提高AP算法在非线性系统中的性能,文献[4]提出了核仿射投影(Kernel Affine Projection, KAP)算法。李群生等人[5]提出的基于多尺度核学习的仿射投影滤波算法利用多个不同高斯核带宽作为可变参数提高收敛性能,并利用惊奇准则降低了计算复杂度。上述算法都是针对高斯噪声背景。然而实际系统中往往存在着脉冲特性显著的环境噪声,一般可以用
α 稳定分布的模型很好地描述[6]。α 稳定分布噪声不存在2阶及2阶以上统计量,所以上述算法均不适用。针对此问题,金明明人[7]基于最小分散系数准则提出了核仿射投影P范数(Kernel Affine Projection P-norm, KAPP)算法。现有的核自适应滤波算法通常基于经典的核技巧,它不需要构造具体的映射函数
φ(⋅) ,是一个生长型的径向基函数网络,它必须保存所有的训练数据,存储成本和计算量大。因此,核函数的显式映射构造及自适应滤波算法得到广泛关注[8-14]。刘勇等人[8]应用泰勒展开公式提出了一种近似高斯核函数的显示构造,Rahimi和Recht[9]基于随机特征来构造平移不变核的特征映射,文献[10-13]将随机特征映射应用在分类和回归应用中;Liu等人[14]提出了基于随机特征网络的核最小均方算法。本文提出一种基于高斯核显式映射的核归一化解相关仿射投影P范数算法(Kernel Normalization Decorrelated Affine Projection P-norm algorithm based on Gaussian Kernel Explicit Mapping, KNDAPP-GKEM)。首先,利用本文提出的高斯核显式映射近似方法得到映射后的输入矩阵Ψ(⋅) ,然后在构造的显式特征空间上实现归一化解相关仿射投影P范数算法。KNDAPP-GKEM算法消除了对历史训练数据的依赖,降低了存储成本和计算量。2. 高斯核显性映射
令L维矢量
Ω=[Ω1,Ω2,···,ΩL]T 为服从均值为0、方差为2h的独立正态分布随机矢量,即Ω∼N(0,2hI) ,其中I为单位矩阵,其概率密度函数ρ(Ω) 和特征函数κ(Δ) 互为傅里叶变换[15],且κ(Δ) 也为高斯函数,有κ(Δ)=exp(−h||Δ||2)=exp[−h(Δ12+···+ΔL2)]=∫RLρ(Ω)exp(jΩTΔ)dΔ=E[exp(jΩTΔ)] (1) 对于
∀x1,x2∈RL ,令Δ=x1−x2=[Δ1,Δ2,···,ΔL]T ,将式(1)所示高斯函数作为核函数κ(x1,x2)=κ(Δ) 。由于高斯核函数是实值函数,由式(1)可得κ(x1,x2)=E[exp(jΩTΔ)]=E[exp(jΩT(x1−x2))]=E[cos(ΩT(x1−x2))] (2) 假定
zΩ,θ=√2cos(ΩTx+θ) ,其中Ω∼N(0,2hI) ,θ 服从(0,2π) 之间均匀分布,即θ∼U(0,2π) ,则E[zTΩ,θ(x1)zΩ,θ(x2)]E[cos(ΩT(x1−x2))]=κ(x1,x2) (3) 由式(3)得到利用D个样本平均值估计核函数为
κ(x1,x2)=<φ(x1),φ(x2)> (4) φ(x)=√2D[cos(Ω1Tx+θ1),cos(Ω2Tx+θ2),···,cos(ΩDTx+θD)] (5) 由式(4)可知,存在特征映射
φ(x) :RL→RD ,使高斯核函数可以被φ(x) 的内积很好地近似。式(5)就是高斯核的显式映射近似函数。3. KNDAPP-GKEM算法
KAPP算法[6]重复利用最近的K个输入信号组成输入矩阵,并利用核方法将该输入矩阵映射到再生核希尔伯特空间中,提高算法非线性性能,但该算法无法得到输入信号的显式映射,所需的存储成本和计算量过大。因此,本文提出了基于高斯核显性映射的核归一化解相关APP(KNADPP-GKEM)算法。
3.1 KNDAPP-GKEM算法推导
本文利用归一化解相关预先处理输入矩阵,使其始终满足相互独立的条件,并利用式(5)得到输入信号的显式映射,消除了算法对历史数据的依赖。在n次迭代时,将最近K个长度为L的输入信号记为输入矩阵
X(n)=[x(n),x(n−1),···,x(n−K+1)] ,其中x(n)=[x(n),x(n−1),···,x(n−L+1)]T ;期望向量d(n)=[d(n),d(n−1),···,d(n−K+1)] ;利用式(5)得到映射后输入矩阵为Ψ(n)=[φ(x(n)),φ(x(n−1)),···,φ(x(n−K+1)) ],则输出向量和误差向量可以表示为y(n)=[y(n),y(n−1),···,y(n−K+1)]=w(n−1)TΨ(n) (6) e(n)=[e(n),e(n−1),···,e(n−K+1)]=d(n)−y(n) (7) 其中
w(n−1) 表示第n–1次迭代时更新得到的权重向量。令代价函数
J(n)=E[|e(n)|p] [6],以瞬时误差值代替其数学期望值,得到梯度估计为∇ωJ(n)=∂J(n)∂w(n)=∂|e(n)|p∂w(n)=p∂e(n)∂w(n)[|e(n)|p−1sgn(e(n))]T=−pΨ(n)eTp(n) (8) 其中,
ep(n) 表示误差向量的分数低阶式,其表达式为ep(n)=[|e(n)|p−1sgn(e(n)),|e(n−1)|p−1⋅sgn(e(n−1)),···,|e(n−K+1)|p−1⋅sgn(e(n−K+1))] (9) 为了提高该算法在强相关输入时的收敛速度,降低稳态均方误差,对输入矩阵
Ψ(n) 进行解相关预处理,利用正交投影定理得到解相关分量为Z(n) Z(n)=Ψ(n)−Ψ(n−1)<Ψ(n−1),Ψ(n−1)>−1Ψ(n−1)TΨ(n) (10) 归一化后得到归一化输入正交矩阵
ZN(n)=Z(n)ZT(n)Z(n)+ε (11) 其中,
ε 为平滑因子,取很小的正整数,防止除零溢出。将ZN(n) 替换式(8)中的输入矩阵Ψ(n) ,得到本文提出的KNDAPP-GKEM算法的权重向量更新公式为w(n)=w(n−1)+μpZN(n)eTp(n) (12) 其中,m为步长,需合适选取以保证算法收敛。
3.2 算法迭代步骤
根据3.1节的分析,得到KNDAPP-GKEM算法的迭代步骤为:
步骤 1 初始化,选择合适的映射维度D,仿射投影长度K,范数p,高斯核参数h,步长
μ 和平滑因子ε ,令w(0)=0 ;采样Ωi∈RL :{Ωi}Di=1∼N(0,2hI) ;采样{θi}Di=1∼U(0,2π) 。步骤 2 利用最近的K个输入信号组成输入矩阵X(n)。
步骤 3 由式(5)得到映射后的输入矩阵
Ψ(n)=[φ(x(n)),φ(x(n−1)),···,φ(x(n−K+1)) 。步骤 4 由式(10)、式(11)得到归一化解相关后的归一化正交矩阵
ZN(n) 。步骤 5 由式(6)、式(7)、式(9)计算输出向量y(n)、误差向量e(n)和误差向量的分数低阶式ep(n)。
步骤 6 利用式(12)更新权重值。
3.3 复杂度分析
表1给出了KNDAPP-GKEM算法在第n次迭代时所需的乘加次数以及在输入数据维度L和映射维度D已知时的计算复杂度。
表 1 KNDAPP-GKEM算法在n时刻的计算复杂度迭代步骤 乘法运算次数 加法运算次数 计算复杂度 映射得到φ(x(n) DL+D DL–D O(1) 归一化计算ZN(n) 2K3+3DK2+2D2K 3DK2+2D2K+2K3–D2–2DK–3K2 O(K3) 计算y(n), e(n)和ep(n) DK +K DK O(K) 更新权重w(n) DK+D+1 DK O(K) 由表1可知,KNDAPP-GKEM算法在n时刻的计算复杂度为O(K3),与训练数据规模n无关,而KAPP算法的计算复杂度为O(n+K2)[6]。在实际应用中,由于训练数据规模n远大于仿射投影长度K,因此,KNDAPP-GKEM算法的计算复杂度远远小于KAPP算法。
KNDAPP-GKEM算法在训练过程中仅需存储最近K个向量长度为D的映射输入信号,而KAPP算法则需要存储所有历史数据。综上所述,KAPP-GKEM算法的计算量和存储成本都比KAPP算法低得多。
4. 参数选择与仿真分析
4.1 仿真背景
本文将KNDAPP-GKEM算法应用于非线性系统辨识,框图如图1所示。非线性系统由非线性单元和线性单元组成,线性单元是一个有限长单位脉冲响应(Finite Impulse Response, FIR)滤波器。
输入信号为
X(n)=σ1X(n−1)+σ2X(n−2)+S(n) ,其中S(n)是均值为0、方差为0.6的高斯白噪声,非线性单元的输出为R(n)=X(n)−0.4X2(n)+0.15X3(n) ,F(n)=HTR(n) ,其中H=[1.000.17 0.410.150.20]T ;v(n) 为α 稳定分布噪声,期望信号为d(n)=F(n)+v(n) 。自适应滤波器的长度L=5;仿射投影长度K=3;步长
μ =0.01;定义广义信噪比GSNR=10lg2σu2/γ ,其中2σu2 为X(n)的方差,γ 为α 稳定分布噪声的分散系数。用2000个样本作为训练数据,100个样本作为测试数据,每一组均采用蒙特卡洛方法进行100次仿真,得到测试均方误差(MSE)曲线。4.2 KNDAPP-GKEM算法参数选择
实验1 维度D对KNDAPP-GKEM算法性能的影响
(1) 不同特征指数
α 下,维度D对KNDAPP-GKEM算法性能的影响。α 稳定分布噪声的特征指数α 分别为1.3, 1.5, 1.7,其他各参数设置为对称系数β=0 、位置参数a=0、分散系数γ=0.04 ;广义信噪比GSNR=10lg2σu2/γ=14dB ; KNDAPP-GKEM算法的参数设置为范数p=α−0.1 ,ε=5×10−4 ,参数h=0.12;迭代2000次后得到强相关输入(σ1=0.9,σ2=−0.6 )时的KNDAPP-GKEM算法测试MSE与映射维度D的变化曲线如图2(a)所示。(2) 不同
α 稳定分布噪声强度下,维度D对KNDAPP-GKEM算法性能的影响。α 稳定分布噪声的特征指数α 为1.3,广义信噪比分别为10 dB、14 dB和18 dB,其他参数设置同实验1(1);同理得到KNDAPP-GKEM算法测试MSE与映射维度D的变化曲线如图2(b)所示。由图2可知,在不同特征指数和广义信噪比的
α 稳定分布噪声背景下,KNDAPP-GKEM算法的测试MSE值均随着D的增加而逐渐减小,且当D增加到一定程度时,测试MSE值减小缓慢。下文仿真取D=80。实验2 核参数h对KNDAPP-GKEM算法性能的影响
α 稳定分布噪声各参数设置同实验1 (2),广义信噪比GSNR为14 dB;KNDAPP-GKEM算法的映射维度D分别为20, 40, 60和80,算法其他参数设置同实验1 (1);迭代2000次后得到强相关输入(σ1=0.9,σ2=−0.6 )时的KNDAPP-GKEM算法的测试MSE与核参数h的变化曲线如图3(a)所示。α 稳定分布噪声的特征指数α 分别为1.3, 1.5, 1.7, GSNR为14 dB, D为80,其他参数同实验1 (1);得到KNDAPP-GKEM算法的测试MSE与核参数h的变化曲线如图3(b)所示。α 稳定分布噪声各参数同实验1 (2), GSNR分别为10 dB, 14 dB和18 dB, D为80,算法其他参数设置同实验1 (1);得到KNDAPP-GKEM算法的测试MSE与核参数h的变化曲线如图3(c)所示。由图3可知,在不同的映射维度D、特征指数
α 和广义信噪比GSNR下,h增大时,KNDAPP-GKEM算法的测试MSE的变化规律一致,均呈现先减小后增大的趋势,当h为0.12时,该算法的测试MSE值最小,性能最好。因此下文仿真取h=0.12。4.3 性能分析
实验3
α 稳定分布噪声背景下DAP, KAPP和KNDAPP-GKEM算法在不同相关强度输入的性能比较α 稳定分布噪声的特征指数α 为1.3, GSNR为14 dB,其他参数同实验1 (1),得到3种算法在弱相关输入(σ1=0.2,σ2=−0.1 )和强相关输入(σ1=0.9,σ2=−0.6 )时的测试MSE曲线分别如图4(a)和图4(b)所示。由图4可知,在
α 稳定分布噪声背景下,DAP算法的测试MSE曲线波动剧烈,性能最差。KNDAPP-GKEM算法的收敛速度较KAPP算法快,且稳态测试MSE值更小。在强相关输入下,KNDAPP-GKEM算法的性能优势更为显著。这是因为KNDAPP-GKEM算法始终保持输入矩阵相互独立,且提出的高斯核显式映射方法能够很好地近似出高斯核。实验4 不同
α 稳定分布噪声强度下KNDAPP-GKEM算法的性能。取GSNR分别为10 dB, 14 dB, 18 dB, KNDAPP-GKEM算法在弱相关输入(σ1=0.2,σ2=−0.1 )时和强相关输入(σ1=0.9,σ2=−0.6 )时的测试MSE曲线分别如图5(a)和图5(b)所示。由图5可得,KNDAPP-GKEM算法在弱相关和强相关的输入时,随着广义信噪比逐渐增加,即
α 稳定分布的分散系数减小,稳态误差均逐渐减小,收敛速度逐渐提高。5. 结束语
在
α 稳定分布噪声下,针对KAPP算法存储容量和计算量过大,且在输入信号强相关时收敛速度慢,稳态性能差的问题,本文提出了KNDAPP-GKEM算法。该算法不仅使输入数据相互独立,而且利用高斯核显式映射方法很好地近似高斯核函数,消除了对历史训练数据的依赖,在每一次迭代时可将历史数据的特征信息存储在权重向量中,大大缩短了训练时长,更加有利于实际系统中大规模数据的应用。 -
表 1 KNDAPP-GKEM算法在n时刻的计算复杂度
迭代步骤 乘法运算次数 加法运算次数 计算复杂度 映射得到φ(x(n) DL+D DL–D O(1) 归一化计算ZN(n) 2K3+3DK2+2D2K 3DK2+2D2K+2K3–D2–2DK–3K2 O(K3) 计算y(n), e(n)和ep(n) DK +K DK O(K) 更新权重w(n) DK+D+1 DK O(K) -
OZEKI K and UMEDA T. An adaptive filtering algorithm using an orthogonal projection to an affine subspace and its properties[J]. Electronics and Communications in Japan, 1984, 67(5): 19–27. doi: 10.1002/ecja.4400670503 王世元, 史春芬, 蒋云翔, 等. 基于q梯度的仿射投影算法及其稳态均方收敛分析[J]. 电子与信息学报, 2018, 40(10): 2402–2407. doi: 10.11999/JEIT171125WANG Shiyuan, SHI Chunfen, JIANG Yunxiang, et al. Q-affine projection algorithm and its steady-state mean square convergence analysis[J]. Journal of Electronics &Information Technology, 2018, 40(10): 2402–2407. doi: 10.11999/JEIT171125 王兰, 杨育红, 李良山. 解相关变阶仿射投影窄带干扰抑制算法[J]. 信息工程大学学报, 2016, 17(3): 266–269, 280. doi: 10.3969/j.issn.1671-0673.2016.03.003WANG Lan, YANG Yuhong, and LI Liangshan. Decorrelating affine projection algorithm with variable order for narrowband interference suppression[J]. Journal of Information Engineering University, 2016, 17(3): 266–269, 280. doi: 10.3969/j.issn.1671-0673.2016.03.003 LIU Weifeng, PRÍNCIPE J C, and HAYKIN S. Kernel Adaptive Filtering: A Comprehensive Introduction[M]. Hoboken, USA: Wiley, 2010: 69–93. 李群生, 赵剡, 寇磊, 等. 一种基于多尺度核学习的仿射投影滤波算法[J]. 电子与信息学报, 2020, 42(4): 924–931. doi: 10.11999/JEIT190023LI Qunsheng, ZHAO Yan, KOU Lei, et al. An affine projection algorithm with multi-scale kernels learning[J]. Journal of Electronics &Information Technology, 2020, 42(4): 924–931. doi: 10.11999/JEIT190023 邱天爽, 张旭秀, 李小兵, 等. 统计信号处理: 非高斯信号处理及其应用[M]. 北京: 电子工业出版社, 2004: 131–171.QIU Tianshuang, ZHANG Xuxiu, LI Xiaobin, et al. Statistical Signal Processing: Non-Gauss Signal Processing and Its Application[M]. Beijing: Electronics Industry Press, 2004: 131–171. 金明明. 核自适应滤波算法研究[D]. [硕士论文], 杭州电子科技大学, 2017: 48–54.JIN Mingming. The research on kernel adaptive filtering algorithms[D]. [Master dissertation], Hangzhou Dianzi University, 2017: 48–54. 刘勇, 江沙里, 廖士中. 基于近似高斯核显式描述的大规模SVM求解[J]. 计算机研究与发展, 2014, 51(10): 2171–2177. doi: 10.7544/issn1000-1239.2014.20130825LIU Yong, JIANG Shali, and LIAO Shizhong. Approximate gaussian kernel for large-scale SVM[J]. Journal of Computer Research and Development, 2014, 51(10): 2171–2177. doi: 10.7544/issn1000-1239.2014.20130825 RAHIMI A and RECHT B. Uniform approximation of functions with random bases[C]. Proceedings of the 46th Annual Allerton Conference on Communication, Control, and Computing, Urbana-Champaign, USA, 2008: 555–561. doi: 10.1109/ALLERTON.2008.4797607. BOROUMAND M and FRIDRICH J. Applications of explicit non-linear feature maps in steganalysis[J]. IEEE Transactions on Information Forensics and Security, 2018, 13(4): 823–833. doi: 10.1109/TIFS.2017.2766580 HU Zhen, LIN Ming, and ZHANG Changshui. Dependent online kernel learning with constant number of random fourier features[J]. IEEE Transactions on Neural Networks and Learning Systems, 2015, 26(10): 2464–2476. doi: 10.1109/TNNLS.2014.2387313 SHARMA M, JAYADEVA, SOMAN S, et al. Large-scale minimal complexity machines using explicit feature maps[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2017, 47(10): 2653–2662. doi: 10.1109/TSMC.2017.2694321 王迎旭. 基于随机特征的多核分布式协同模糊聚类算法研究[D]. [硕士论文], 济南大学, 2019: 21–65.WANG Yingxu. Research of random feature based multiple kernel collaborative fuzzy clustering method in P2P distributed network[D]. [Master dissertation], University of Jinan, 2019: 21–65. LIU Yuqi, SUN Chao, and JIANG Shouda. A kernel least mean square algorithm based on randomized feature networks[J]. Applied Sciences, 2018, 8(3): 458. doi: 10.3390/app8030458 王永德, 王军. 随机信号分析基础[M]. 3版. 北京: 电子工业出版社, 2009: 11.WANG Yongde and WANG Jun. Fundamentals of Random Signal Analysis[M]. 3rd ed. Beijing: Electronic Industry Press, 2009: 11. 期刊类型引用(2)
1. 胡璞,刘利民. 基于拟合优化的多传感器测距误差残差补偿修正算法设计. 传感技术学报. 2023(11): 1783-1787 . 百度学术
2. 陈怡,谢金凤,徐千淞,刘彦鹏. 一种非高斯脉冲干扰下的混合线性和非线性自适应滤波算法研究. 信息记录材料. 2022(03): 205-207 . 百度学术
其他类型引用(0)
-