高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于对称KL距离的用户行为时序聚类方法

李文璟 曾祥健 李梦 喻鹏

徐勇军, 杨浩克, 李国军, 陈前斌. 多标签无线供电反向散射通信网络能效优化算法[J]. 电子与信息学报, 2022, 44(10): 3492-3498. doi: 10.11999/JEIT210772
引用本文: 李文璟, 曾祥健, 李梦, 喻鹏. 基于对称KL距离的用户行为时序聚类方法[J]. 电子与信息学报, 2018, 40(10): 2365-2372. doi: 10.11999/JEIT180016
XU Yongjun, YANG Haoke, LI Guojun, CHEN Qianbin. Energy-efficient Optimization Algorithm in Multi-tag Wireless-powered Backscatter Communication Networks[J]. Journal of Electronics & Information Technology, 2022, 44(10): 3492-3498. doi: 10.11999/JEIT210772
Citation: Wenjing LI, Xiangjian ZENG, Meng LI, Peng YU. Time Series Method Clustering in User Behavior Based on Symmetric Kullback-Leibler Distance[J]. Journal of Electronics & Information Technology, 2018, 40(10): 2365-2372. doi: 10.11999/JEIT180016

基于对称KL距离的用户行为时序聚类方法

doi: 10.11999/JEIT180016
基金项目: 国家电网公司科技项目(52010116000W)
详细信息
    作者简介:

    李文璟:女,1973年生,教授,研究方向为网络管理与通信软件、未来网络智能管理

    曾祥健:男,1993年生,硕士生,研究方向为网络管理与智能信息处理

    李梦:女,1993年生,硕士生,研究方向为网络管理与智能信息处理

    喻鹏:男,1986年生,副教授,研究方向为基于人工智能的网络管理

    通讯作者:

    曾祥健  zeng_fsh@163.com

  • 中图分类号: TN915.07

Time Series Method Clustering in User Behavior Based on Symmetric Kullback-Leibler Distance

Funds: The Project of Science and Technology of State Grid Corporation of China (52010116000W)
  • 摘要: 网络用户随时间变化的行为分析是近年来用户行为分析的热点,通常为了发现用户行为的特征需要对用户做聚类处理。针对用户时序数据的聚类问题,现有研究方法存在计算性能差,距离度量不准确的缺点,无法处理大规模数据。为了解决上述问题,该文提出基于对称KL距离的用户行为时序聚类方法。首先将时序数据转化为概率模型,从划分聚类的角度出发,在距离度量中引入KL距离,用以衡量不同用户间的时间分布差异。针对实网数据中数据规模大的特点,该方法在聚类的各个环节针对KL距离的特点做了优化,并证明了一种高效率的聚类质心求解办法。实验结果证明,该算法相比采用欧式距离和DTW距离度量的聚类算法能提高4%的准确度,与采用medoids聚类质心的聚类算法相比计算时间少了一个量级。采用该算法对实网环境中获取的用户流量数据处理证明了该算法拥有可行的应用价值。
  • 随着通信技术的飞速发展以及无线设备的迅猛增长,大量传感器节点或终端设备将会接入到物联网中,如何维持节点的传输效率和解决无线供能将会成为制约物联网大规模部署的关键问题。近年来,学者提出了反向散射通信这一技术用来解决上述问题[1]。反向散射通信通过反向散射设备反射和调制入射的射频波以此进行数据传输,因此,反向散射设备不需要产生主动射频信号以及进行模数转换,从而减小了能量消耗[2]

    资源分配技术通过对发射功率、传输时间以及载波分配等因子进行动态的调整,实现对无线通信资源的合理调度,从而使得系统性能最优,同时满足每个用户的服务质量[3,4]。目前,对反向散射通信的研究已取得了许多有价值的成果[5-13]。文献[5]通过联合优化时间分配和功率分配比,最大化数据传输速率。文献[6]考虑在发射功率约束和传输时间的约束下,通过优化时间分配和波束成形向量,提出了基于块坐标下降法的吞吐量最大化算法。文献[7]考虑反向散射通信网络场景,联合优化反向散射设备的传输时间和功率反射系数,提出了基于连续凸近似的次优迭代算法。文献[8]针对认知反向散射通信网络场景,在保证主系统最低速率的需求下,使得反向散射设备的吞吐量最大化。文献[9]通过联合优化时间调度、功率分配和能量波束向量最大化系统加权和速率。文献[10]提出了一种时间分配和反射系数选择的策略以最大化系统的吞吐量。文献[5-10]主要集中在对系统传输速率的研究,忽略了能耗问题,并且大部分交替迭代算法只能获得次优解。为了实现传输速率与系统能耗之间的平衡关系,文献[11,12]研究了无线供电反向散射通信网络能效优化问题,但单标签场景过于理想。文献[13]将上述问题拓展到多用户系统,然而没有考虑时间分配,无法满足5G差异化业务需求。

    为了解决上述问题,本文针对多标签无线供电反向散射通信网络,研究系统能效最大化的最优功率分配、反射系数及能量收集时间求解问题,主要贡献如下:

    (1) 建立了多标签无线供电反向散射通信网络系统模型。在传输速率约束、能量收集约束、反射系数约束、发射功率约束以及传输时间的约束下,通过对发射功率、反射系数和传输时间的联合优化,提出了多变量耦合的非凸分式能效最大化资源分配问题。

    (2) 为求解上述非凸问题,利用Dinkelbach方法将原问题转化为函数相减的形式;然后利用2次变换方法和变量替换法,将上述问题进一步转化为凸优化问题;最后,通过拉格朗日对偶原理求得全局最优解。

    (3) 仿真结果表明,与现有算法对比,所提算法具有较好的收敛性和能效。

    本文考虑由1个基站、K个标签和1个网关组成的无线供电反向散射通信网络,如图1所示。基站、标签及网关都配备单天线,所有标签具有反向散射电路模块,标签集合定义为kK={1,2,,K}。在时隙T内,基站通过时分多址接入方式给每个标签传输信息,每个标签的传输时间为τk且满足Kk=1τkT,τk0,k。在传输时间τk内,标签通过天线阻抗将接收到的信号分成两部分,一部分反射到网关,另一部分用于标签的自身供能[14];反射信号通过反射信道与网关建立联系,收集的能量信号用于标签自身的供电。假设所有信道满足块衰落信道,即在一个小的时间帧内保持不变,在整个时间过程是时变。

    图 1  系统模型

    假设基站到标签k的信道增益定义为hk,那么标签k的接收信号可以描述为

    yk(τk)=Pkhksk(τk)+nk
    (1)

    其中,Pk表示基站发送给标签k的发射功率;sk(τk)表示在时隙τk基站发送给标签k的信号,且满足E{|sk(τk)|2}=1nkCN(0,σ2k)表示标签k处服从均值为零方差为σ2k的加性高斯白噪声。因此,此时网关的接收信号为

    yRk(τk)=αkgkyk(τk)ck(τk)+Pkhsk(τk)+n
    (2)

    其中,αk表示标签k的反射系数;gk表示标签k到网关的信道增益;ck(τk)表示标签k自身的反射信号,且满足E{|ck(τk)|2}=1nCN(0,σ2)表示网关处服从均值为零方差为σ2的加性高斯白噪声;h表示基站到网关的信道增益。从而标签k传输时,网关接收到的信噪比为γRk=αkgkhkPkαkgkσ2k+Pkh+σ2。其中,分母的第1项为标签自身噪声干扰影响,因为该噪声非常小,在现有文献中经常被忽略[5-8]。因此,网关信噪比可以重新表示为

    ˉγRk=αkgkhkPkPkh+σ2
    (3)

    因此网关的瞬时速率为RRk=log2(1+ˉγRk)

    系统的总能耗为

    Etotal=Kk=1τk[Pk+ECk(1αk)ηkPkhk]
    (4)

    其中,ECk表示标签k的电路功耗;ηk[0,1]表示标签k的能量转换因子。

    考虑在传输速率约束、能量收集约束以及传输时间约束下,建立了能效最大化资源分配问题为

    maxαk,τk,Pk Kk=1τkRRkEtotals.tC1:RRkRR,mink C2:(1αk)ηkPkhkEC,minkC3:0αk1C4:Kk=1PkPmax,Pk0C5:Kk=1τkT,τk0 }
    (5)

    其中,C1表示最小瞬时速率约束,RR,mink表示最小速率门限;C2表示标签k收集的能量大于其消耗的能量,EC,mink为最小能量收集门限;C3表示反射系数αk约束;C4表示发射功率约束,Pmax表示基站的最大发射功率门限;C5表示传输时间约束。式(5)为多变量耦合的分式非凸规划问题,难以求解。

    基于Dinkelbach方法[15],目标函数可以转化为

    f(ηEE)=ˉRtotalηEEEtotal
    (6)

    其中,ηEE0是辅助变量;ˉRtotal = Kk=1τkRRk。当ηEE趋近于无穷大时,f(ηEE)<0成立,否则f(ηEE)0。因此,f(ηEE)是关于ηEE的严格递减的凸函数。当τk,αk,Pk为最优解时

    f(ηEE)=ˉRtotal(τk,αk,Pk)ηEEEtotal(τk,αk,Pk)=0
    (7)

    其中,ηEE = ˉRtotal(τk,αk,Pk)/Etotal(τk,αk,Pk)

    因此,式(5)可以重新表述为

    maxαk,τk,Pk Kk=1{τk{log2(1+αkgkhkPkPkh+σ2)ηEE[Pk+ECk(1αk)ηkPkhk]}s.t.C1C5}
    (8)

    由式(8)可知,传输时间τk仅与约束条件C5有关。因此,首先求出传输时间τk的最优解,然后通过2次变换以及变量替换方法将非凸问题转化为凸优化问题,最后使用拉格朗日对偶理论进行求解。

    根据式(8)分解出关于传输时间τk的子问题为

    maxτk Kk=1{τk{log2(1+αkgkhkPkPkh+σ2)ηEE[Pk+ECk(1αk)ηkPkhk]}s.t.C5:Kk=1τkT,τk0 }
    (9)

    显然,式(9)为线性规划问题,可以通过线性规划求解方法求出最优的传输时间τk

    根据变量替换方法,定义βk=αkPk,式(8)可以重新表示为

    maxβk,Pk Kk=1{τk[log2(1+βkgkhkPkh+σ2)ηEE(Pk+ECkPkhkηk+βkhkηk)]}s.tˉC1:βkgkhk(2RR,mink1)(Pkh+σ2ˉC2:hkηk(Pkβk)EC,minkˉC3:0βkPkˉC4:Kk=1PkPmax,Pk0}
    (10)

    由于目标函数是非凸的,式(10)仍为非凸优化问题,难以求得最优解。根据2次变换方法[16,17],式(10)可以重新描述为

    maxβk,Pk,xk Kk=1{τk[fk(βk,Pk,xk)ηEE(Pk+ECkPkhkηk+βkhkηk)]}s.tˉC1ˉC4}
    (11)

    其中,xk是辅助变量;fk(βk,Pk,xk) = log2[1+2xkβkgkhkx2k(Pkh+σ2)]xk的最优值xk=2βkgkhkPkh+σ2。因此,式(11)可以重新表示为

    maxβk,Pk Kk=1{τk[fk(βk,Pk,xk)ηEE(Pk+ECkPkhkηk+βkhkηk)]}s.tˉC1ˉC4}
    (12)

    式(12)为凸优化问题,可以通过拉格朗日对偶理论对其进行求解。定义Yk={βk,Pk,μk,ωk,εk,ν},式(12)的拉格朗日函数为

    L(Yk)=Kk=1τk[fk(βk,Pk,xk)ηEE(Pk+ECkPkhkηk+βkhkηk)]+Kk=1εk(Pkβk)+ν(PmaxKk=1Pk)+Kk=1μk[βkgkhk(2RR,mink1)(Pkh+σ2)]+Kk=1ωk[hkηk(Pkβk)EC,mink]
    (13)

    其中,μk,ωk,εk,ν表示非负的拉格朗日乘子。式(13)可以重新表示为

    L(Yk) = Kk=1Lk(Yk)+νPmax
    (14)

    其中

    Lk(Yk) = τk[fk(βk,Pk,xk)ηEE(Pk+ECkPkhkηk+βkhkηk)]+εk(Pkβk)νPk+μk[βkgkhk(2RR,mink1)(Pkh+σ2]+ωk[hkηk(Pkβk)EC,mink]
    (15)

    对于给定的能效ηEE,式(14)的对偶问题为

    minμk,ωk,εk,νD(μk,ωk,εk,ν) s.tμk0,ωk0,εk0,ν0}
    (16)

    其中,对偶函数为

    D(μk,ωk,εk,ν) = maxβk,PkL(Yk)
    (17)

    根据卡罗需-库恩-塔克(Karush-Kuhn-Tucker, KKT)条件[18],可以得到如式(18)和式(19)的闭式解

    Pk=[τkln2[ν+μkh(2RR,mink1)εkωkhkηk+τkηEEτkηEEhkηk]+1+2βkgkhkxkhσ2h]+
    (18)
    βk=[τkln2(ηEEhk+ωkηkhk+εkμk)+xk(Pkh+σ2)12gkhk]+
    (19)

    其中,[x]+=max(0,x)。基于梯度下降方法,拉格朗日乘子更新表达式为

    μl+1k=[μlkΔμk×Lk(Yk)μk]+
    (20)
    ωl+1k=[ωlkΔωk×Lk(Yk)ωk]+
    (21)
    εl+1k=[εlkΔεk×Lk(Yk)εk]+
    (22)
    νl+1=[νlΔν×Lk(Yk)ν]+
    (23)

    其中,Lk(Yk)/Lk(Yk)ωkωk = hkηk(Pkβk)EC,mink, Lk(Yk)/Lk(Yk)νν = Pk, Lk(Yk)/Lk(Yk)εkεk = Pkβk, Lk(Yk)/μk = βkgkhk(2RR,mink1)(Pkh+σ2, l表示迭代次数,Δμk, Δωk, Δεk, Δν为大于0的迭代步长。根据Pkβk的关系,可以计算出最优的反射系数αk = βk/βkPkPk。因此,基于迭代的能效最大化资源分配算法如表1所示。

    表 1  基于迭代的能效最大化资源分配算法
     初始化系统参数K,hk,gk,h,σ2,T,Pmax,RR,mink,ECk,EC,mink
     给定初始化能效ηEE,外层迭代次数t=0
     定义算法收敛精度ϖ,外层最大迭代次数为Tmax
     (1) while|R(t)Etotal(t)ηEE(t1)|>ϖtTmax, do
     (2) 初始化迭代步长和拉格朗日乘子,内层最大迭代次数Lmax
       初始化内层迭代次数l = 0
     (3) while 所有拉格朗日乘子的收敛精度大于ϖdo
     (4)   for k = 1:K
     (5)     根据式(18)计算最优功率Pk
     (6)     根据式(19)计算βk
     (7)     计算反射系数αk
     (8)     根据式(20)—式(23)更新拉格朗日乘子
           μk,ωk,εk,ν
     (9)   end for
     (10)   更新l=l+1
     (11) until 收敛或l = Lmax
     (12) end while

     (13) 更新ηEE(t)=Kk=1τkR(t1)Etotal(t1)t=t+1
     (14) end while
     (15) 输出所需优化变量Pk,βk,αk
    下载: 导出CSV 
    | 显示表格

    假设外层能效和内层拉格朗日法的最大迭代次数分别为TmaxLmax。根据梯度下降法,更新μk,ωk,εk,ν需要O(K)O(1)次运算,拉格朗日乘子更新的计算复杂度为O(K+1)。内层迭代次数LmaxO((K+1)Lmax)的多项式函数;外循环使用Dinkelbach方法求解能效的计算复杂度是O(log2(Tmax)/ϖ2)[19]。因此,本文算法的计算复杂度为O{ln(1/˜ϑ)(K+1)Lmaxlog2(Tmax)/ϖ2},其中,˜ϑ表示解的精度。

    在本节中,通过仿真分析验证所提算法的有效性。假设网络中有1个基站、5个标签和1个网关,其中,基站到5个标签的距离分别为4 m, 5 m, 5.5 m, 6 m, 6.5 m,2个标签到网关的距离分别为3 m, 3.5 m, 4 m, 4.5 m, 5 m 。信道模型为dχi, 其中di是基站、标签和网关之间的距离, χ=3表示路径损耗指数[20]T = 1 s, σ2 = 108 W, RR,mink = 0.6 bit/Hz, ηk = 0.7, ϖ = 106, Tmax=104, Lmax=104[21]

    图2描述了本文所提算法的系统能效与迭代次数之间的关系曲线。从图2可以看出,所提算法在经过较少的迭代后趋于收敛。基站到网关之间的距离增大时,系统能效随之增大。这是因为距离增大,基站到网关之间的信道增益h减小,从式(3)可以看出,系统受到的干扰变小。

    图 2  不同信道状态下所提算法的收敛性能

    图3比较了在不同的发射功率门限下的性能。从图3可以看出,随着发射功率门限的增加,系统能效首先增加,随后保持不变。这是因为更大的发射功率门限允许基站具有更大的发射功率,从而提高了系统能效,当发射功率门限Pmax=1 W,1.5 W2 W时,系统能效将会趋于收敛。

    图 3  不同发射功率门限下所提算法的收敛性能

    图4描述了不同发射功率门限下系统能效与标签个数关系。从图4可看出,随着标签个数的增加,系统能效增加。因为,当标签个数增加时,系统的有效传输速率将会提高,导致系统能效增加。当Pmax提高时,系统能效增加。因为基站将会具有更大的发射功率,使得系统能效增加。

    图 4  不同标签个数下所提算法的收敛性能

    图5描述了在不同的标签电路功耗下所提算法的性能。从图5可以看出,本文算法在经过较少的迭代后趋于收敛。随着标签电路功耗的增加,系统能效将会减少。这是因为功耗提高,导致能效降低。

    图 5  不同电路功耗下所提算法的收敛性能

    图6描述了在不同算法下系统能效与发射功率门限之间的关系。本文算法的能效是要高于速率最大算法以及能耗最小算法,并且随着发射功率门限的增加,本文算法首先增长,然后趋于收敛,而速率最大算法先增加再下降,这是因为能耗的增加要高于速率的增加,从而导致系统能效降低。

    图 6  不同算法下系统能效与基站功率门限之间的关系

    图7描述了在不同算法下能量收集门限与系统能效的关系。随着能量收集门限的增加,系统能效会下降。本文算法考虑了速率与能耗之间的权衡,并且以系统能效最大化为目标函数;速率最大算法不包含能耗,能量收集门限对其影响较小;能耗最小算法只考虑了能耗,忽略了传输速率这一指标,因此本文算法的能效要高于另外两种算法。

    图 7  不同算法下能量收集门限与系统能效的关系

    本文研究了多标签无线供电反向散射通信网络能效优化问题,考虑用户速率约束、能量收集约束、反射系数约束、发射功率约束以及传输时间约束,通过对反射系数、传输时间和发射功率的联合优化,建立了基于系统能效最大化的资源分配模型。针对所提优化问题,利用Dinkelbach理论、2次变换及变量替换方法,将原分式非凸问题转化为可求解的凸优化问题,通过拉格朗日对偶法求得最优解。仿真结果表明,本文算法具有较好的能效以及收敛性。

  • 图  1  不同概率值上 ˉci 取不同值的距离差异

    图  2  人工生成数据

    图  3  不同K值的轮廓系数情况

    图  4  聚类结果

    图  5  用户的时间行为整体分布情况

    表  1  基于KL距离的用户行为时序聚类算法

     输入:数据集data,类数目k,停止迭代参数threshold
     输出:聚类结果cluster
     cluster
     old_cluster
       //初始化cluster, old_cluster
     data_log = pre_computed(data)
       //预计算data的对数运算
      k_centers = centers_init(data, k)
       //选择初始质心
     for i in iteration:
      clear cluster;
      centers_log = pre_computed(k_centers)
        //预计算质心的对数运算
      for u in data:
       分配u到距离最近的cluster
       k_centers:= computed(cluster, data)
        //重新计算质心
      if i > 3 && overlap(cluster, old_cluster)>threshold:
         //子类重合度大于threshold时停止迭代
       break;
      else:
       old_cluster <- cluster
    下载: 导出CSV

    表  2  变形描述

    变形形式 参数
    随机噪声 高斯噪声,零均值,标准差 σ=0.10, 0.12, 0.15
    平移 横轴平移, β=0.10, 0.30, 0.50
    幅值缩放 λ=0.50, 1.50, 2.00
    自变量按比例缩放 时间轴缩放, α=1.05, 1.08, 1.10
    线性误差 斜率 ϕ=0.20, 0.50, 1.00
    偏置系数 视情况而定,可以取为序列数据中最小值的绝对值,也可以取为常数,本文取 γ=3.00
    下载: 导出CSV

    表  3  各算法聚类准确率和计算时间

    聚类算法和度量方法 Kmeans+欧氏距离 Kmeans+DTW PAM+KL 本文算法
    FMI 0.863 0.856 0.852 0.892
    时间(s) 0.099 187.589 0.336 0.046
    下载: 导出CSV

    表  4  2017年7月20号至2017年7月21号之间的流记录统计数据

    统计指标 数值
    流记录规模(104条) 270
    去重源IP数目 203356
    去重目的IP数目 113728
    单条最长的流记录时间(ms) 50315672
    单条最短的流记录时间(ms) <1
    平均流记录时间(ms) 11586.79
    单条流记录最高流量总字节(GByte) 2.126
    单条流记录最低流量总字节(Byte) 60
    流记录平均流量总字节(Byte) 55945.96
    单条流记录最高流量速率(MByte/s) 69.5
    单条流记录最低流量速率(Byte/s) <1
    单条流记录平均流量速率(Byte/s) 50866.89
    下载: 导出CSV

    表  5  原始流记录转换为概率模型算法

    输入:流记录集D,时间粒度参数L,用户数量M
    输出:用户流量概率模型 users
    初始化数组 users[M][T], users_tmp[M][T]
    for r in D:
     userid:=r对应的用户id
     beginTime:=r开始的时间
     endTime:=r结束的时间
     speed:=r的平均传输速率
     users[userid][beginTime] += speed
     users_tmp[userid][endTime] += speed
    for i=0, i<M; i++:
     for j=1; j<L; j++:
      users[i][j]=users[i][j –1]-users_tmp[ i][j –1]+users[ i][j]
      if users[i][j]==0: //KL距离是对数计算,需要对序列进行平滑
       users[i][j]=1
    下载: 导出CSV

    表  6  聚类结果分析

    类别 人数(人) 分析
    1 2464 主要集中在下午时段使用,占比达到30%,
    并且持续时间从下午到晚上。
    2 2713 这部分用户在15点附近使用幅度最高,总体
    对网络依赖性较高。
    3 4862 所有类别中人数最多的类,主要使用时段是
    20点之后,并且逐渐升高,使用时段集中。
    4 2444 主要在深夜和早上使用网络,其他时段使用
    较为平均。
    5 3250 主要集中在早上使用,使用时间跨度较大。
    6 3778 从晚上开始逐渐升高使用量,在20点左右达
    到最高,这一类人可能是在下班后使用网络。
    7 2725 跨度较小,主要集中在中午时段使用。
    下载: 导出CSV
  • 延皓. 基于流量监测的网络用户行为分析[D]. [博士论文], 北京邮电大学, 2011.

    YAN H. Network user behavior analysis base on traffic monitoring and measurement[D]. [Ph.D. dissertation], Beijing University of Post and Telecommunications, 2011.
    NAJAFABADI M M, KHOSHGOFTAAR T M, CALVERT C, et al. User behavior anomaly detection for application layer DDoS attacks[C]. 2017 IEEE International Conference on Information Reuse and Integration (IRI), San Diego, USA, 2017: 154–161.
    方志祥, 于冲, 张韬, 等. 手机用户上网时段的混合Markov预测方法[J]. 地球信息科学学报, 2017, 19(8): 1019–1025 doi: 10.3724/SP.J.1047.2017.01019

    FANG Zhixiang, YU Chong, ZHANG Tao, et al. A mixed arkov method to predict the surfing time period of mobile phone users[J]. Journal of Geo-Information Science, 2017, 19(8): 1019–1025 doi: 10.3724/SP.J.1047.2017.01019
    毛佳昕, 刘奕群, 张敏, 等. 基于用户行为的微博用户社会影响力分析[J]. 计算机学报, 2014, 37(4): 791–800 doi: 10.3724/SP.J.1016.2014.00791

    MAO Jiaxin, LIU Yiqun, ZHANG Min, et al. Social influence anal sis for micro-blog user based on user behavior[J]. Chinese Journal of Computers, 2014, 37(4): 791–800 doi: 10.3724/SP.J.1016.2014.00791
    ZHU Jiang, WANG Baixuan, and WU Bin. Social network users clustering based on multivariate time series of emotional behavior[J]. Journal of China Universities of Posts and Telecommunications, 2014, 21(2): 21–31 doi: 10.1016/S1005-8885(14)60282-X
    YAN Hao, DOU Yinan, LIU Fang, et al. Time division based on analyses of network user time span preference[C]. 2009 IEEE International Conference on Network Infrastructure and Digital Content, Beijing, China, 2009: 177–181.
    SALGADO C M, FERREIRA M C, and VIEIRA S M. Mixed fuzzy clustering for misaligned time series[J]. IEEE Transactions on Fuzzy Systems, 2017, 25(6): 1777–1794 doi: 10.1109/TFUZZ.2016.2633375
    TEERARATKUL T, NEILL D O, and LALL S. Shape-based approach to household electric load curve clustering and prediction[J]. IEEE Transactions on Smart Grid, 2017 doi: 10.1109/TSG.2017.2683461
    GHASSEMPOUR S, GIROSI F, and MAEDER A. Clustering multivariate time series using hidden markov models[J]. International Journal of Environmental Research and Public Health, 2014, 11(3): 2741–2763 doi: 10.3390/ijerph110302741
    AGHABOZORGI S, SHIRKHORSHIDI A S, and WAH T Y. Time-series clustering — A decade review[J]. Information Systems, 2015, 53: 16–38 doi: 10.1016/j.is.2015.04.007
    RATANAMAHATANA C, KEOGH E, BAGNALL A J, et al. A Novel Bit level time series representation with implication of similarity search and clustering[C]. 9th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining, Hanoi, 2005: 771–777.
    KEOGH E J and PAZZANI M J. A simple dimensionality reduction technique for fast similarity search in large time series databases[C]. 4th Pacific-Asia Conference on Knowledge Discovery and Data Mining, Kyoto, Japan, 2000: 122–133.
    KULLBACK S and LEIBLER R A. On information and sufficiency[J]. The Annals of Mathematical Statistics, 1951, 22(1): 79–86 doi: 10.1214/aoms/1177729694
    FOWLKES E B and MALLOWS C L. A method for comparing two hierarchical clusterings[J]. Journal of the American Statistical Association, 1983, 78(383): 553–569 doi: 10.1080/01621459.1983.10478008
    ROUSSEEUW P J. Silhouettes: A graphical aid to the interpretation and validation of cluster analysis[J]. Journal of Computational and Applied Mathematics, 1986, 20(1): 53–65 doi: 10.1016/0377-0427(87)90125
  • 期刊类型引用(9)

    1. 欧丰林,林淑彬. 融合高斯混合模型和深度学习的目标跟踪. 吉林师范大学学报(自然科学版). 2020(01): 127-134 . 百度学术
    2. 张明月,王静. 基于深度学习的交互似然目标跟踪算法. 计算机科学. 2019(02): 279-285 . 百度学术
    3. 马义超,赵运基,张新良. 基于PCA初始化卷积核的CNN手写数字识别算法. 计算机工程与应用. 2019(13): 134-139 . 百度学术
    4. 蔡楠,李萍. 基于KPCA初始化卷积神经网络的方法. 计算机技术与发展. 2019(07): 76-79 . 百度学术
    5. 张烁,张荣. 基于卷积神经网络模型的手写数字辨识算法研究. 计算机应用与软件. 2019(08): 172-176+261 . 百度学术
    6. 毕笃彦,王世平,刘坤,何林远. 基于并行映射卷积网络的超分辨率重建算法. 系统工程与电子技术. 2018(08): 1873-1880 . 百度学术
    7. 韩东,王学军. 基于改进的卷积神经网络多姿态人脸识别研究. 吉林大学学报(信息科学版). 2018(05): 376-381 . 百度学术
    8. 梁蒙蒙,周涛,张飞飞,杨健,夏勇. 卷积神经网络及其在医学图像分析中的应用研究. 生物医学工程学杂志. 2018(06): 977-985 . 百度学术
    9. 樊养余,李祖贺,王凤琴,马江涛. 基于跨领域卷积稀疏自动编码器的抽象图像情绪性分类. 电子与信息学报. 2017(01): 167-175 . 本站查看

    其他类型引用(32)

  • 加载中
图(5) / 表(6)
计量
  • 文章访问数:  2479
  • HTML全文浏览量:  665
  • PDF下载量:  93
  • 被引次数: 41
出版历程
  • 收稿日期:  2018-01-04
  • 修回日期:  2018-06-27
  • 网络出版日期:  2018-07-30
  • 刊出日期:  2018-10-01

目录

/

返回文章
返回