Time Series Method Clustering in User Behavior Based on Symmetric Kullback-Leibler Distance
-
摘要: 网络用户随时间变化的行为分析是近年来用户行为分析的热点,通常为了发现用户行为的特征需要对用户做聚类处理。针对用户时序数据的聚类问题,现有研究方法存在计算性能差,距离度量不准确的缺点,无法处理大规模数据。为了解决上述问题,该文提出基于对称KL距离的用户行为时序聚类方法。首先将时序数据转化为概率模型,从划分聚类的角度出发,在距离度量中引入KL距离,用以衡量不同用户间的时间分布差异。针对实网数据中数据规模大的特点,该方法在聚类的各个环节针对KL距离的特点做了优化,并证明了一种高效率的聚类质心求解办法。实验结果证明,该算法相比采用欧式距离和DTW距离度量的聚类算法能提高4%的准确度,与采用medoids聚类质心的聚类算法相比计算时间少了一个量级。采用该算法对实网环境中获取的用户流量数据处理证明了该算法拥有可行的应用价值。
-
关键词:
- 时序聚类 /
- 用户分析 /
- Kullback-Leibler距离
Abstract: Behavioral analysis of Internet users over time is a hot spot in user behavior analysis in recent years, usually clustering users is a way to find the feature of user behavior. Problems like poor computing performance or inaccurate distance metric exist in present research about clustering user time series data, which is unable to deal with large scale data. To solve this problem, a method for clustering time series in user behavior is proposed based on symmetric Kullback-Leibler (KL) distance. First time series data is transformed into probability models, and then a distance metric named KL distance is introduce, using partition clustering method, the different time distribution between different users. For the Large-scale feature of physical network data, each process of clustering is optimized based on the characteristics of KL distance. It also proves an efficient solution for finding the clustering centroids. The experimental results show that this method can improve the accuracy of 4% compared with clustering algorithm using the Euclidean distance metric or DTW metric, and the calculation time of this method is less a quantity degree than clustering algorithm using medoids centroids. This method is used to deal with user traffic data obtained in physical network which proves its application value.-
Key words:
- Time series clustering /
- User analysis /
- Kullback-Leibler distance
-
1. 引言
随着通信技术的飞速发展以及无线设备的迅猛增长,大量传感器节点或终端设备将会接入到物联网中,如何维持节点的传输效率和解决无线供能将会成为制约物联网大规模部署的关键问题。近年来,学者提出了反向散射通信这一技术用来解决上述问题[1]。反向散射通信通过反向散射设备反射和调制入射的射频波以此进行数据传输,因此,反向散射设备不需要产生主动射频信号以及进行模数转换,从而减小了能量消耗[2]。
资源分配技术通过对发射功率、传输时间以及载波分配等因子进行动态的调整,实现对无线通信资源的合理调度,从而使得系统性能最优,同时满足每个用户的服务质量[3,4]。目前,对反向散射通信的研究已取得了许多有价值的成果[5-13]。文献[5]通过联合优化时间分配和功率分配比,最大化数据传输速率。文献[6]考虑在发射功率约束和传输时间的约束下,通过优化时间分配和波束成形向量,提出了基于块坐标下降法的吞吐量最大化算法。文献[7]考虑反向散射通信网络场景,联合优化反向散射设备的传输时间和功率反射系数,提出了基于连续凸近似的次优迭代算法。文献[8]针对认知反向散射通信网络场景,在保证主系统最低速率的需求下,使得反向散射设备的吞吐量最大化。文献[9]通过联合优化时间调度、功率分配和能量波束向量最大化系统加权和速率。文献[10]提出了一种时间分配和反射系数选择的策略以最大化系统的吞吐量。文献[5-10]主要集中在对系统传输速率的研究,忽略了能耗问题,并且大部分交替迭代算法只能获得次优解。为了实现传输速率与系统能耗之间的平衡关系,文献[11,12]研究了无线供电反向散射通信网络能效优化问题,但单标签场景过于理想。文献[13]将上述问题拓展到多用户系统,然而没有考虑时间分配,无法满足5G差异化业务需求。
为了解决上述问题,本文针对多标签无线供电反向散射通信网络,研究系统能效最大化的最优功率分配、反射系数及能量收集时间求解问题,主要贡献如下:
(1) 建立了多标签无线供电反向散射通信网络系统模型。在传输速率约束、能量收集约束、反射系数约束、发射功率约束以及传输时间的约束下,通过对发射功率、反射系数和传输时间的联合优化,提出了多变量耦合的非凸分式能效最大化资源分配问题。
(2) 为求解上述非凸问题,利用Dinkelbach方法将原问题转化为函数相减的形式;然后利用2次变换方法和变量替换法,将上述问题进一步转化为凸优化问题;最后,通过拉格朗日对偶原理求得全局最优解。
(3) 仿真结果表明,与现有算法对比,所提算法具有较好的收敛性和能效。
2. 系统模型
本文考虑由1个基站、
K 个标签和1个网关组成的无线供电反向散射通信网络,如图1所示。基站、标签及网关都配备单天线,所有标签具有反向散射电路模块,标签集合定义为∀k∈K={1,2,⋯,K} 。在时隙T 内,基站通过时分多址接入方式给每个标签传输信息,每个标签的传输时间为τk 且满足∑Kk=1τk≤T,τk≥0,∀k 。在传输时间τk 内,标签通过天线阻抗将接收到的信号分成两部分,一部分反射到网关,另一部分用于标签的自身供能[14];反射信号通过反射信道与网关建立联系,收集的能量信号用于标签自身的供电。假设所有信道满足块衰落信道,即在一个小的时间帧内保持不变,在整个时间过程是时变。假设基站到标签
k 的信道增益定义为hk ,那么标签k 的接收信号可以描述为yk(τk)=√Pkhksk(τk)+nk (1) 其中,
Pk 表示基站发送给标签k 的发射功率;sk(τk) 表示在时隙τk 基站发送给标签k 的信号,且满足E{|sk(τk)|2}=1 ;nk∼CN(0,σ2k) 表示标签k 处服从均值为零方差为σ2k 的加性高斯白噪声。因此,此时网关的接收信号为yRk(τk)=√αkgkyk(τk)ck(τk)+√Pkhsk(τk)+n (2) 其中,
αk 表示标签k 的反射系数;gk 表示标签k 到网关的信道增益;ck(τk) 表示标签k 自身的反射信号,且满足E{|ck(τk)|2}=1 ;n∼CN(0,σ2) 表示网关处服从均值为零方差为σ2 的加性高斯白噪声;h 表示基站到网关的信道增益。从而标签k 传输时,网关接收到的信噪比为γRk=αkgkhkPkαkgkσ2k+Pkh+σ2 。其中,分母的第1项为标签自身噪声干扰影响,因为该噪声非常小,在现有文献中经常被忽略[5-8]。因此,网关信噪比可以重新表示为ˉγRk=αkgkhkPkPkh+σ2 (3) 因此网关的瞬时速率为
RRk=log2(1+ˉγRk) 。系统的总能耗为
Etotal=K∑k=1τk[Pk+ECk−(1−αk)ηkPkhk] (4) 其中,
ECk 表示标签k 的电路功耗;ηk∈[0,1] 表示标签k 的能量转换因子。考虑在传输速率约束、能量收集约束以及传输时间约束下,建立了能效最大化资源分配问题为
maxαk,τk,Pk K∑k=1τkRRkEtotals.t. C1:RRk≥RR,mink C2:(1−αk)ηkPkhk≥EC,minkC3:0≤αk≤1C4:K∑k=1Pk≤Pmax,Pk≥0C5:K∑k=1τk≤T,τk≥0 } (5) 其中,
C1 表示最小瞬时速率约束,RR,mink 表示最小速率门限;C2 表示标签k 收集的能量大于其消耗的能量,EC,mink 为最小能量收集门限;C3 表示反射系数αk 约束;C4 表示发射功率约束,Pmax 表示基站的最大发射功率门限;C5 表示传输时间约束。式(5)为多变量耦合的分式非凸规划问题,难以求解。3. 最优资源分配算法
基于Dinkelbach方法[15],目标函数可以转化为
f(ηEE)=ˉRtotal−ηEEEtotal (6) 其中,
ηEE≥0 是辅助变量;ˉRtotal = ∑Kk=1τkRRk 。当ηEE 趋近于无穷大时,f(ηEE)<0 成立,否则f(ηEE)≥0 。因此,f(ηEE) 是关于ηEE 的严格递减的凸函数。当τ∗k,α∗k,P∗k 为最优解时f(ηEE)=ˉRtotal(τ∗k,α∗k,P∗k)−η∗EEEtotal(τ∗k,α∗k,P∗k)=0 (7) 其中,
η∗EE = ˉRtotal(τ∗k,α∗k,P∗k)/Etotal(τ∗k,α∗k,P∗k) 。因此,式(5)可以重新表述为
maxαk,τk,Pk K∑k=1{τk{log2(1+αkgkhkPkPkh+σ2)−ηEE[Pk+ECk−(1−αk)ηkPkhk]} }s.t.C1∼C5} (8) 由式(8)可知,传输时间
τk 仅与约束条件C5 有关。因此,首先求出传输时间τk 的最优解,然后通过2次变换以及变量替换方法将非凸问题转化为凸优化问题,最后使用拉格朗日对偶理论进行求解。3.1 求解最优传输时间
τ∗k 根据式(8)分解出关于传输时间
τk 的子问题为maxτk K∑k=1{τk{log2(1+αkgkhkPkPkh+σ2)−ηEE[Pk+ECk−(1−αk)ηkPkhk]} }s.t.C5:K∑k=1τk≤T,τk≥0 } (9) 显然,式(9)为线性规划问题,可以通过线性规划求解方法求出最优的传输时间
τ∗k 。3.2 求解最优发射功率
P∗k 根据变量替换方法,定义
βk=αkPk ,式(8)可以重新表示为maxβk,Pk K∑k=1{τk[log2(1+βkgkhkPkh+σ2)−ηEE(Pk+ECk−Pkhkηk+βkhkηk)]}s.t. ˉC1:βkgkhk≥(2RR,mink−1)(Pkh+σ2) ˉC2:hkηk(Pk−βk)≥EC,minkˉC3:0≤βk≤PkˉC4:K∑k=1Pk≤Pmax,Pk≥0} (10) 由于目标函数是非凸的,式(10)仍为非凸优化问题,难以求得最优解。根据2次变换方法[16,17],式(10)可以重新描述为
maxβk,Pk,xk K∑k=1{τk[fk(βk,Pk,xk)−ηEE(Pk+ECk−Pkhkηk+βkhkηk)]}s.t. ˉC1∼ˉC4} (11) 其中,
xk 是辅助变量;fk(βk,Pk,xk) = log2[1+2xk√βkgkhk−x2k(Pkh+σ2)] 。xk 的最优值x∗k=2√βkgkhkPkh+σ2 。因此,式(11)可以重新表示为maxβk,Pk K∑k=1{τk[fk(βk,Pk,x∗k)−ηEE(Pk+ECk−Pkhkηk+βkhkηk)]}s.t. ˉC1∼ˉC4} (12) 式(12)为凸优化问题,可以通过拉格朗日对偶理论对其进行求解。定义
Yk={βk,Pk,μk,ωk,εk,ν} ,式(12)的拉格朗日函数为L(Yk)=K∑k=1τk[fk(βk,Pk,x∗k)−ηEE(Pk+ECk−Pkhkηk+βkhkηk)]+K∑k=1εk(Pk−βk)+ν(Pmax−K∑k=1Pk)+K∑k=1μk[βkgkhk−(2RR,mink−1)(Pkh+σ2)]+K∑k=1ωk[hkηk(Pk−βk)−EC,mink] (13) 其中,
μk,ωk,εk,ν 表示非负的拉格朗日乘子。式(13)可以重新表示为L(Yk) = K∑k=1Lk(Yk)+νPmax (14) 其中
Lk(Yk) = τk[fk(βk,Pk,x∗k)−ηEE(Pk+ECk−Pkhkηk+βkhkηk)]+εk(Pk−βk)−νPk+μk[βkgkhk−(2RR,mink−1)(Pkh+σ2) ]+ωk[hkηk(Pk−βk)−EC,mink] (15) 对于给定的能效
ηEE ,式(14)的对偶问题为minμk,ωk,εk,νD(μk,ωk,εk,ν) s.t. μk≥0,ωk≥0,εk≥0,ν≥0} (16) 其中,对偶函数为
D(μk,ωk,εk,ν) = maxβk,PkL(Yk) (17) 根据卡罗需-库恩-塔克(Karush-Kuhn-Tucker, KKT)条件[18],可以得到如式(18)和式(19)的闭式解
P∗k=[τkln2[ν+μkh(2RR,mink−1)−εk−ωkhkηk+τkηEE−τkηEEhkηk]+1+2√βkgkhkx∗kh−σ2h]+ (18) β∗k=[τkln2(ηEEhk+ωkηkhk+εk−μk)+x∗k(Pkh+σ2)−12√gkhk]+ (19) 其中,
[x]+=max(0,x) 。基于梯度下降方法,拉格朗日乘子更新表达式为μl+1k=[μlk−Δμk×∂Lk(Yk)∂μk]+ (20) ωl+1k=[ωlk−Δωk×∂Lk(Yk)∂ωk]+ (21) εl+1k=[εlk−Δεk×∂Lk(Yk)∂εk]+ (22) νl+1=[νl−Δν×∂Lk(Yk)∂ν]+ (23) 其中,
∂Lk(Yk)/∂Lk(Yk)∂ωk∂ωk = hkηk(Pk−βk)−EC,mink ,∂Lk(Yk)/∂Lk(Yk)∂ν∂ν = −Pk ,∂Lk(Yk)/∂Lk(Yk)∂εk∂εk = Pk−βk ,∂Lk(Yk)/∂μk = βkgkhk−(2RR,mink−1)(Pkh+σ2) ,l 表示迭代次数,Δμk, Δωk, Δεk, Δν 为大于0的迭代步长。根据P∗k 与β∗k 的关系,可以计算出最优的反射系数α∗k = β∗k/β∗kP∗kP∗k 。因此,基于迭代的能效最大化资源分配算法如表1所示。表 1 基于迭代的能效最大化资源分配算法初始化系统参数K,hk,gk,h,σ2,T,Pmax,RR,mink,ECk,EC,mink;
给定初始化能效ηEE,外层迭代次数t=0;定义算法收敛精度ϖ,外层最大迭代次数为Tmax; (1) while|R(t)Etotal(t)−ηEE(t−1)|>ϖ或t≤Tmax, do (2) 初始化迭代步长和拉格朗日乘子,内层最大迭代次数Lmax,
初始化内层迭代次数l = 0;(3) while 所有拉格朗日乘子的收敛精度大于ϖ,do (4) for k = 1:K (5) 根据式(18)计算最优功率P∗k; (6) 根据式(19)计算β∗k; (7) 计算反射系数α∗k; (8) 根据式(20)—式(23)更新拉格朗日乘子
μk,ωk,εk,ν;(9) end for (10) 更新l=l+1; (11) until 收敛或l = Lmax; (12) end while
(13) 更新ηEE(t)=K∑k=1τkR(t−1)Etotal(t−1)和t=t+1;(14) end while (15) 输出所需优化变量P∗k,β∗k,α∗k。 3.3 复杂度分析
假设外层能效和内层拉格朗日法的最大迭代次数分别为
Tmax 和Lmax 。根据梯度下降法,更新μk,ωk,εk,ν 需要O(K) 和O(1) 次运算,拉格朗日乘子更新的计算复杂度为O(K+1) 。内层迭代次数Lmax 是O((K+1)Lmax) 的多项式函数;外循环使用Dinkelbach方法求解能效的计算复杂度是O(log2(Tmax)/ϖ2) [19]。因此,本文算法的计算复杂度为O{ln(1/˜ϑ)(K+1)Lmaxlog2(Tmax)/ϖ2} ,其中,˜ϑ 表示解的精度。4. 仿真结果与分析
在本节中,通过仿真分析验证所提算法的有效性。假设网络中有1个基站、5个标签和1个网关,其中,基站到5个标签的距离分别为4 m, 5 m, 5.5 m, 6 m, 6.5 m,2个标签到网关的距离分别为3 m, 3.5 m, 4 m, 4.5 m, 5 m 。信道模型为
d−χi , 其中di 是基站、标签和网关之间的距离,χ=3 表示路径损耗指数[20]。T = 1 s ,σ2 = 10−8 W ,RR,mink = 0.6 bit/Hz ,ηk = 0.7 ,ϖ = 10−6 ,Tmax=104 ,Lmax=104 [21]。图2描述了本文所提算法的系统能效与迭代次数之间的关系曲线。从图2可以看出,所提算法在经过较少的迭代后趋于收敛。基站到网关之间的距离增大时,系统能效随之增大。这是因为距离增大,基站到网关之间的信道增益
h 减小,从式(3)可以看出,系统受到的干扰变小。图3比较了在不同的发射功率门限下的性能。从图3可以看出,随着发射功率门限的增加,系统能效首先增加,随后保持不变。这是因为更大的发射功率门限允许基站具有更大的发射功率,从而提高了系统能效,当发射功率门限
Pmax=1 W,1.5 W和2 W 时,系统能效将会趋于收敛。图4描述了不同发射功率门限下系统能效与标签个数关系。从图4可看出,随着标签个数的增加,系统能效增加。因为,当标签个数增加时,系统的有效传输速率将会提高,导致系统能效增加。当
Pmax 提高时,系统能效增加。因为基站将会具有更大的发射功率,使得系统能效增加。图5描述了在不同的标签电路功耗下所提算法的性能。从图5可以看出,本文算法在经过较少的迭代后趋于收敛。随着标签电路功耗的增加,系统能效将会减少。这是因为功耗提高,导致能效降低。
图6描述了在不同算法下系统能效与发射功率门限之间的关系。本文算法的能效是要高于速率最大算法以及能耗最小算法,并且随着发射功率门限的增加,本文算法首先增长,然后趋于收敛,而速率最大算法先增加再下降,这是因为能耗的增加要高于速率的增加,从而导致系统能效降低。
图7描述了在不同算法下能量收集门限与系统能效的关系。随着能量收集门限的增加,系统能效会下降。本文算法考虑了速率与能耗之间的权衡,并且以系统能效最大化为目标函数;速率最大算法不包含能耗,能量收集门限对其影响较小;能耗最小算法只考虑了能耗,忽略了传输速率这一指标,因此本文算法的能效要高于另外两种算法。
5. 结论
本文研究了多标签无线供电反向散射通信网络能效优化问题,考虑用户速率约束、能量收集约束、反射系数约束、发射功率约束以及传输时间约束,通过对反射系数、传输时间和发射功率的联合优化,建立了基于系统能效最大化的资源分配模型。针对所提优化问题,利用Dinkelbach理论、2次变换及变量替换方法,将原分式非凸问题转化为可求解的凸优化问题,通过拉格朗日对偶法求得最优解。仿真结果表明,本文算法具有较好的能效以及收敛性。
-
表 1 基于KL距离的用户行为时序聚类算法
输入:数据集data,类数目k,停止迭代参数threshold 输出:聚类结果cluster cluster old_cluster //初始化cluster, old_cluster data_log = pre_computed(data) //预计算data的对数运算 k_centers = centers_init(data, k) //选择初始质心 for i in iteration: clear cluster; centers_log = pre_computed(k_centers) //预计算质心的对数运算 for u in data: 分配u到距离最近的cluster k_centers:= computed(cluster, data) //重新计算质心 if i > 3 && overlap(cluster, old_cluster)>threshold: //子类重合度大于threshold时停止迭代 break; else: old_cluster <- cluster 表 2 变形描述
变形形式 参数 随机噪声 高斯噪声,零均值,标准差 σ=0.10, 0.12, 0.15 平移 横轴平移, β=0.10, 0.30, 0.50 幅值缩放 λ=0.50, 1.50, 2.00 自变量按比例缩放 时间轴缩放, α=1.05, 1.08, 1.10 线性误差 斜率 ϕ=0.20, 0.50, 1.00 偏置系数 视情况而定,可以取为序列数据中最小值的绝对值,也可以取为常数,本文取 γ=3.00 表 3 各算法聚类准确率和计算时间
聚类算法和度量方法 Kmeans+欧氏距离 Kmeans+DTW PAM+KL 本文算法 FMI 0.863 0.856 0.852 0.892 时间(s) 0.099 187.589 0.336 0.046 表 4 2017年7月20号至2017年7月21号之间的流记录统计数据
统计指标 数值 流记录规模(104条) 270 去重源IP数目 203356 去重目的IP数目 113728 单条最长的流记录时间(ms) 50315672 单条最短的流记录时间(ms) <1 平均流记录时间(ms) 11586.79 单条流记录最高流量总字节(GByte) 2.126 单条流记录最低流量总字节(Byte) 60 流记录平均流量总字节(Byte) 55945.96 单条流记录最高流量速率(MByte/s) 69.5 单条流记录最低流量速率(Byte/s) <1 单条流记录平均流量速率(Byte/s) 50866.89 表 5 原始流记录转换为概率模型算法
输入:流记录集D,时间粒度参数L,用户数量M 输出:用户流量概率模型 users 初始化数组 users[M][T], users_tmp[M][T] for r in D: userid:=r对应的用户id beginTime:=r开始的时间 endTime:=r结束的时间 speed:=r的平均传输速率 users[userid][beginTime] += speed users_tmp[userid][endTime] += speed for i=0, i<M; i++: for j=1; j<L; j++: users[i][j]=users[i][j –1]-users_tmp[ i][j –1]+users[ i][j] if users[i][j]==0: //KL距离是对数计算,需要对序列进行平滑 users[i][j]=1 表 6 聚类结果分析
类别 人数(人) 分析 1 2464 主要集中在下午时段使用,占比达到30%,
并且持续时间从下午到晚上。2 2713 这部分用户在15点附近使用幅度最高,总体
对网络依赖性较高。3 4862 所有类别中人数最多的类,主要使用时段是
20点之后,并且逐渐升高,使用时段集中。4 2444 主要在深夜和早上使用网络,其他时段使用
较为平均。5 3250 主要集中在早上使用,使用时间跨度较大。 6 3778 从晚上开始逐渐升高使用量,在20点左右达
到最高,这一类人可能是在下班后使用网络。7 2725 跨度较小,主要集中在中午时段使用。 -
延皓. 基于流量监测的网络用户行为分析[D]. [博士论文], 北京邮电大学, 2011.YAN H. Network user behavior analysis base on traffic monitoring and measurement[D]. [Ph.D. dissertation], Beijing University of Post and Telecommunications, 2011. NAJAFABADI M M, KHOSHGOFTAAR T M, CALVERT C, et al. User behavior anomaly detection for application layer DDoS attacks[C]. 2017 IEEE International Conference on Information Reuse and Integration (IRI), San Diego, USA, 2017: 154–161. 方志祥, 于冲, 张韬, 等. 手机用户上网时段的混合Markov预测方法[J]. 地球信息科学学报, 2017, 19(8): 1019–1025 doi: 10.3724/SP.J.1047.2017.01019FANG Zhixiang, YU Chong, ZHANG Tao, et al. A mixed arkov method to predict the surfing time period of mobile phone users[J]. Journal of Geo-Information Science, 2017, 19(8): 1019–1025 doi: 10.3724/SP.J.1047.2017.01019 毛佳昕, 刘奕群, 张敏, 等. 基于用户行为的微博用户社会影响力分析[J]. 计算机学报, 2014, 37(4): 791–800 doi: 10.3724/SP.J.1016.2014.00791MAO Jiaxin, LIU Yiqun, ZHANG Min, et al. Social influence anal sis for micro-blog user based on user behavior[J]. Chinese Journal of Computers, 2014, 37(4): 791–800 doi: 10.3724/SP.J.1016.2014.00791 ZHU Jiang, WANG Baixuan, and WU Bin. Social network users clustering based on multivariate time series of emotional behavior[J]. Journal of China Universities of Posts and Telecommunications, 2014, 21(2): 21–31 doi: 10.1016/S1005-8885(14)60282-X YAN Hao, DOU Yinan, LIU Fang, et al. Time division based on analyses of network user time span preference[C]. 2009 IEEE International Conference on Network Infrastructure and Digital Content, Beijing, China, 2009: 177–181. SALGADO C M, FERREIRA M C, and VIEIRA S M. Mixed fuzzy clustering for misaligned time series[J]. IEEE Transactions on Fuzzy Systems, 2017, 25(6): 1777–1794 doi: 10.1109/TFUZZ.2016.2633375 TEERARATKUL T, NEILL D O, and LALL S. Shape-based approach to household electric load curve clustering and prediction[J]. IEEE Transactions on Smart Grid, 2017 doi: 10.1109/TSG.2017.2683461 GHASSEMPOUR S, GIROSI F, and MAEDER A. Clustering multivariate time series using hidden markov models[J]. International Journal of Environmental Research and Public Health, 2014, 11(3): 2741–2763 doi: 10.3390/ijerph110302741 AGHABOZORGI S, SHIRKHORSHIDI A S, and WAH T Y. Time-series clustering — A decade review[J]. Information Systems, 2015, 53: 16–38 doi: 10.1016/j.is.2015.04.007 RATANAMAHATANA C, KEOGH E, BAGNALL A J, et al. A Novel Bit level time series representation with implication of similarity search and clustering[C]. 9th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining, Hanoi, 2005: 771–777. KEOGH E J and PAZZANI M J. A simple dimensionality reduction technique for fast similarity search in large time series databases[C]. 4th Pacific-Asia Conference on Knowledge Discovery and Data Mining, Kyoto, Japan, 2000: 122–133. KULLBACK S and LEIBLER R A. On information and sufficiency[J]. The Annals of Mathematical Statistics, 1951, 22(1): 79–86 doi: 10.1214/aoms/1177729694 FOWLKES E B and MALLOWS C L. A method for comparing two hierarchical clusterings[J]. Journal of the American Statistical Association, 1983, 78(383): 553–569 doi: 10.1080/01621459.1983.10478008 ROUSSEEUW P J. Silhouettes: A graphical aid to the interpretation and validation of cluster analysis[J]. Journal of Computational and Applied Mathematics, 1986, 20(1): 53–65 doi: 10.1016/0377-0427(87)90125 期刊类型引用(9)
1. 欧丰林,林淑彬. 融合高斯混合模型和深度学习的目标跟踪. 吉林师范大学学报(自然科学版). 2020(01): 127-134 . 百度学术
2. 张明月,王静. 基于深度学习的交互似然目标跟踪算法. 计算机科学. 2019(02): 279-285 . 百度学术
3. 马义超,赵运基,张新良. 基于PCA初始化卷积核的CNN手写数字识别算法. 计算机工程与应用. 2019(13): 134-139 . 百度学术
4. 蔡楠,李萍. 基于KPCA初始化卷积神经网络的方法. 计算机技术与发展. 2019(07): 76-79 . 百度学术
5. 张烁,张荣. 基于卷积神经网络模型的手写数字辨识算法研究. 计算机应用与软件. 2019(08): 172-176+261 . 百度学术
6. 毕笃彦,王世平,刘坤,何林远. 基于并行映射卷积网络的超分辨率重建算法. 系统工程与电子技术. 2018(08): 1873-1880 . 百度学术
7. 韩东,王学军. 基于改进的卷积神经网络多姿态人脸识别研究. 吉林大学学报(信息科学版). 2018(05): 376-381 . 百度学术
8. 梁蒙蒙,周涛,张飞飞,杨健,夏勇. 卷积神经网络及其在医学图像分析中的应用研究. 生物医学工程学杂志. 2018(06): 977-985 . 百度学术
9. 樊养余,李祖贺,王凤琴,马江涛. 基于跨领域卷积稀疏自动编码器的抽象图像情绪性分类. 电子与信息学报. 2017(01): 167-175 . 本站查看
其他类型引用(32)
-