Loading [MathJax]/jax/element/mml/optable/GeneralPunctuation.js
高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

簇间可分的鲁棒模糊C均值聚类算法

高云龙 杨程宇 王志豪 罗斯哲 潘金艳

高云龙, 杨程宇, 王志豪, 罗斯哲, 潘金艳. 簇间可分的鲁棒模糊C均值聚类算法[J]. 电子与信息学报, 2019, 41(5): 1114-1121. doi: 10.11999/JEIT180604
引用本文: 高云龙, 杨程宇, 王志豪, 罗斯哲, 潘金艳. 簇间可分的鲁棒模糊C均值聚类算法[J]. 电子与信息学报, 2019, 41(5): 1114-1121. doi: 10.11999/JEIT180604
Yunlong GAO, Chengyu YANG, Zhihao WANG, Sizhe LUO, Jinyan PAN. Robust Fuzzy C-means Clustering Algorithm Integrating Between-cluster Information[J]. Journal of Electronics & Information Technology, 2019, 41(5): 1114-1121. doi: 10.11999/JEIT180604
Citation: Yunlong GAO, Chengyu YANG, Zhihao WANG, Sizhe LUO, Jinyan PAN. Robust Fuzzy C-means Clustering Algorithm Integrating Between-cluster Information[J]. Journal of Electronics & Information Technology, 2019, 41(5): 1114-1121. doi: 10.11999/JEIT180604

簇间可分的鲁棒模糊C均值聚类算法

doi: 10.11999/JEIT180604
基金项目: 国家自然科学基金(61203176),福建省自然科学基金(2013J05098, 2016J01756)
详细信息
    作者简介:

    高云龙:男,1979年生,副教授,研究方向为机器学习、时间序列分析和生产制造系统优化与调度

    杨程宇:男,1996年生,本科生,研究方向为机器学习

    王志豪:男,1993年生,硕士生,研究方向为模式识别和机器学习

    罗斯哲:男,1995年生,硕士生,研究方向为维数约简、模式识别和机器学习

    潘金艳:女,1978年生,副教授,研究方向为人工智能和机器学习理论与方法

    通讯作者:

    潘金艳 gaoyl@xmu.edu.cn

  • 中图分类号: TP311.13

Robust Fuzzy C-means Clustering Algorithm Integrating Between-cluster Information

Funds: The National Natural Science Foundation of China (61203176), The Natural Science Foundation of Fujian Province (2013J05098, 2016J01756)
  • 摘要:

    与经典的K均值聚类算法相比,模糊C均值(FCM)聚类算法通过引入模糊因子,考虑不同聚类数据簇之间的相互关系,得到可分性更好的聚类结果。但是模糊因子的引入,使得任意一个样本点都存在模糊性,造成FCM极易受到噪声和离群点的影响,聚类结果泛化性能较差。因此,该文提出一种簇间可分的鲁棒FCM算法(RBI-FCM)。RBI-FCM利用K均值算法对模糊隶属度的稀疏特征,降低不同数据簇之间的相互作用,突出不同数据簇相邻区域的可分性;另外,RBI-FCM在极小化数据簇内部散布度的条件下,考虑不同数据簇之间的可分性,可提高聚类模型的泛化性能。该文设计了有效的模型求解迭代算法。实验结果表明,RBI-FCM算法提高了FCM的鲁棒性,有效降低FCM对数据簇分布差异性和抽样不均衡的敏感性,得到理想的聚类结果。

  • 作为模式识别、数据挖掘等方向重要研究内容之一,聚类分析在识别数据内在结构方面发挥着重要作用,被广泛应用于生物、经济、医学、计算机等众多领域[16]。根据聚类过程中数据的集聚规则,聚类算法可以被分为4类:基于划分、基于层次、基于密度和基于网格的聚类算法[7]。其中基于划分的聚类算法因其算法流程简单,运算复杂度低而得到广泛研究与运用,K均值(K-means)算法和模糊C均值(Fuzzy C-Means, FCM)算法是该类型聚类算法中最著名的两个算法。与K-means算法相比,FCM算法引入模糊信息使得其对数据样本的划分较为柔性,从而得到更加广泛地关注[8]

    在过去很多年,以FCM算法为基础,很多学者从各个不同方面,提出了众多改进的FCM,取得了一系列新的研究成果。例如:为了加强FCM算法的灵活性,文献[7,8]从自动确定数据集聚类个数入手,提出了改进的模糊聚类算法;为了降低FCM算法对噪声的敏感性,文献[9]通过放松FCM算法的隶属度约束,提出了可能性模糊C均值聚类算法(Possibilistic Fuzzy C-Means, PFCM);针对传统FCM算法对噪声敏感及对边界样本聚类不准确问题,肖满生等人[10]通过将各个样本间的空间距离引入到聚类影响值中,提出了一种空间相关性与隶属度平滑的FCM改进算法;为了能降低FCM算法对样本容量差异的敏感性,Liu等人[11]通过向模糊隶属度迭代式引入类大小参数,提出了一个新的改进的模糊聚类算法;史慧峰等人[12]通过结合有效性函数,提出了自适应的模糊C均值聚类算法,保证了传统的FCM算法在不依赖初始条件情况下,可以得到正确有效的聚类结果,并可自动判定类别数;文献[13]通过改进FCM算法目标函数,提出了可分性更强的广义模糊C聚类算法(Generalized Fuzzy C-Means clustering algorithm with Improved Fuzzy Partitions, GIFP-FCM),有效提高了FCM算法聚类性能。

    这些文献在一定程度上对传统FCM算法进行了成功改进并取得了较好的研究成果,但也存在一定局限性,具体表现在:(1)任意一个样本点都存在模糊性,造成这些改进的方法极易受到噪声和离群点的影响,算法的鲁棒性较差,泛化性能不强;(2)容易对数据簇形成等势划分,受抽样不均衡和不同数据簇分布特征差异性影响极大。本文在分析国内外最新研究进展的基础上,提出一种簇间可分的鲁棒模糊C均值聚类算法(Robust Fuzzy C-Means clustering integrating Between-cluster Information, RBI-FCM)。RBI-FCM通过利用K-means对模糊隶属度的稀疏性特征,有效降低可靠样本点的模糊性,提高对边缘离散样本点聚类鲁棒性;通过引入整体散布度,在极小化数据簇内部散布度的条件下,考虑不同数据簇之间的可分性,有效提高聚类算法的泛化性能。由于RBI-FCM模型存在众多超参数,因此,本文设计了有效的模型求解迭代算法,将对超参数βj的设置转化为对单一参数β的设置,极大降低了参数初始值设置的复杂度,简化了算法对于初始值的选取。实验结果表明本文所提算法有效降低了对抽样不均衡和不同数据簇分布特征差异性的敏感性,具有较强的聚类稳定性。

    1969年,著名学者Ruspini首次提出模糊划分概念并将模糊集理论引入聚类分析,1974年,Dunn[14]首次提出模糊C均值聚类算法,并在之后由Bezdek发展起来[15]。FCM算法通过优化目标函数,得到聚类中心与每个样本点对各个类中心的隶属度,并以此对样本点进行类的划分。FCM建模为

    J(uij,vi)=ci=1nj=1umijxjvi2,ci=1uij=1,j=1,2,···,n (1)

    其中,m>1是模糊系数,c为聚类个数,vi为第i个聚类中心,xj为第j个样本点,uij[0,1]为隶属度值。

    FCM算法对所有样本点都以计算其对类中心的欧式距离作为类划分的标准,使得其受噪声和离群点影响较大,聚类稳定性较低。另外FCM算法主要适用于样本容量均匀、分布规律的情况,对簇分布特征差异性敏感。因此,为了增强聚类稳定性,提高聚类效果,需要对FCM算法目标函数模型进行改进。

    簇间可分的鲁棒模糊C均值聚类算法对FCM目标函数进行改进,基于K-means稀疏化特征对隶属度进行自适应加权以提高算法鲁棒性,增强离群点的聚类有效性,并考虑类间可分性,降低对簇分布差异敏感性,其目标函数如式(2)

    J(uij,vi)=ci=1nj=1umijxjvi2+ci=1nj=1βjuij(1um1ij)xjvi2 (2)

    其中,βj是一组超参数。对式(2)目标函数进行简单数学变换可得

    minU,VJ(uij,vi)=ci=1nj=1(1βj)umijxjvi2+ci=1nj=1βjuijxjvi2 (3)

    m=2有

    minU,VJ(uij,vi)=ci=1nj=1(1βj)(uij+βj2(1βj))2xjvi2β2j4(1βj)ci=1nj=1xjvi2 (4a)

    对于式(4a)中的第2部分有

    1nci=1nj=1xjvi2=1nci=1nj=1(xjv)(viv)2=1nci=1nj=1(xjv22(xjv)(viv)+viv2)=cnnj=1xjv2+ci=1viv2 (4b)

    其中,v=1nnj=1xj, cnj=1xjv2为固定常数,优化过程中忽略不计。基于式(4b),式(4a)变为

    minU,VJ(uij,vi)=ci=1nj=1(1βj)(uij+βj2(1βj))2xjvi2nβ2j4(1βj)ci=1nj=1viv2 (4c)

    式(4c)的目标函数由两部分确定。其中第1个部分确定每个样本点的模糊隶属度,对于任意一个样本点,(1βj)仅影响多目标组合的权重,而不影响模糊隶属度的计算,因此在计算模糊隶属度的过程中可忽略不计,即在βjvi给定的条件下,模糊隶属度由式(4d)优化问题确定

    minUci=1nj=1(uij+βj2(1βj))2xjvi2s.t. ci=1uij=1} (4d)

    通过与式(1)比较可见,模型式(4d)在约束条件下,通过对模糊隶属度进行平移,提高了样本点属于不同数据簇模糊隶属度的对比度,从而降低了样本点的模糊程度。基于文献[16]和文献[17]可知,这一特性提高了模糊聚类算法对边缘样本点的鲁棒性。

    式(4c)的目标函数第2个部分考虑了不同数据簇之间的可分性,在极小化数据簇内散布度的同时,极大化不同聚类数据簇之间的可分性。基于文献[18]可知,这一部分有效降低了FCM算法对抽样不均衡和数据簇分布特征差异性的敏感性。基于这两个属性把式(2)称作簇间可分的鲁棒模糊C均值聚类算法。

    由式(2),建立拉格朗日辅助函数

    L(uij,vi)=ci=1nj=1umijxjvi2+ci=1nj=1βjuij(1um1ij)xjvi2nj=1λj(ci=1uij1) (5)

    d 2ij=∥xjvi2,将式(5)对uij求偏导,并令结果等于0,可得

    L(uij,vi)uij=0mum1ijd2ij(1βj)+βjd2ijλj=0uij=(λj(βjd2ij)md2ij(1βj)1/(m1)) (6)

    考虑到β=(β1,β2,···,βn)为一组超参数,为方便求解,简化参数设置,令

    β=βjλj,j=1,2,···,n (7)

    将式(7)代入式(6)得

    uij=[λj(1βd 2ij)/(md 2ij(1βj))]1/(m1) (8)

    基于约束ci=1uij=1,由式(8)可得

    ci=1uij=ci=1[λj(1βd 2ij)/(md 2ij(1βj))]1/(m1)=1λ1m1j=1ci=1[(1βd 2ij)/(md 2ij(1βj))]1/(m1)

    (9)

    将式(9)代入式(8)得

    uij=1ck=1(1βd 2kjmd 2kj(1βj))1/(m1)(1βd 2ijmd 2ij(1βj))1/(m1)=(1/d 2ijβ)1/(m1)ck=1(1/d 2kjβ)1/(m1) (10)

    式(10)即为RBI-FCM算法隶属度迭代更新公式,有效地将对超参数的设置转化为对单一参数β的设置,成功地简化了算法的参数设置。对聚类中心vi求偏导,并令结果等于0,可得

    L(uij,vi)/vi=2nj=1umij(xjvi)2nj=1βjuij(1um1ij)(xjvi)=0 (11)

    简化式(11)得

    vi=nj=1umijxj+nj=1βjuij(1um1ij)xjnj=1umij+nj=1βjuij(1um1ij) (12)

    由给定条件β=βjλj(j=1,2,···,n),并代入式(9),建立βj的迭代更新式如式(13)

    β(new)j=λjβ=(1ci=1(1βd2ijmd2ij(1β(old)j))1/(m1))m1β (13)

    vi的迭代更新式(12)中含有超参数βj,所以在更新之前先需对βj进行迭代更新计算。

    RBI-FCM通过下列步骤确定聚类中心V和样本对各个类的隶属度值U

    步骤 1 设定模糊系数m和聚类个数c,随机挑选c个样本点初始化聚类中心V(0),设定最大迭代次数tmax和目标函数误差收敛阈值ε,设定非负参数β,初始化βj=0,令迭代次数t=0

    步骤 2 通过式(10)更新隶属度矩阵U(t)

    步骤 3 通过式(12)、式(13)更新聚类中心V(t+1)

    步骤 4 令t=t+1

    步骤 5 若t<tmax并且,重复步骤2, 3, 4,否则算法停止。

    RBI-FCM算法是对FCM算法关于边缘样本有效界定的改进,在极小化类内散布度的条件下,考虑簇间的可分性,减小对数据簇的抽样不均衡性和分布特征差异性的敏感性,增强算法的聚类鲁棒性。如图1所示,当对一个类样本容量有差异的数据集进行聚类时,从聚类结果最大隶属度曲线分布情况不难发现,FCM受数据簇容量差异的影响,小类样本中心发生明显偏移导致样本的误判。RBI-FCM算法基于K-means稀疏化特征,考虑簇与簇之间的可分性,对边缘样本隶属度进行加权处理,减弱了样本数据分布的影响,得到了有效的聚类结果。

    图 1  聚类结果最大隶属度值曲线分布情况

    为验证本算法的有效性,分别对人造样本数据集和UCI数据集进行了聚类实验,并将聚类结果与FCM, PFCM和GIFP-FCM算法进行比较。其中,为验证RBI-FCM算法的强鲁棒性,对3类人造样本数据集聚类情况进行实验分析,包括各类样本疏密程度有差异的数据集、各类样本容量有差异数据集和各类样本非球形分布数据集。实验环境:Lenovo, CPU: 2 GHz, RAM; 4 GB, Program: MATLAB R2014b。每次实验最大迭代次数{t_{\max }}和收敛阈值\varepsilon 分别设为100和0.00000001,模糊系数m设为2。

    为对实验聚类结果正确率评判,本文采用标准化互信息评价标准(Normalized Mutual Information, NMI)和兰德指数(Rand Index, RI),标准化互信息以联合熵和个体熵之间的关系来评价聚类结果与标准正确聚类结果的相似度,是常用在聚类中度量聚类结果的一种评价标准。NMI大小为0~1,值越大,意味着聚类结果正确率越高,与正确聚类结果越相近。NMI定义式如式(14)

    {\rm{NMI}} = \frac{{\displaystyle\sum\limits_{i = 1}^c {\displaystyle\sum\limits_{j = 1}^c {P(i,j)\lg \frac{{P(i,j)}}{{P(i)P(j)}}} } }}{{\sqrt {\displaystyle\sum\limits_{i = 1}^c {P(i)\lg P(i)\displaystyle\sum\limits_{j = 1}^c {P(j)\lg P(j)} } } }} (14)

    其中,i为通过实验所得的聚类结果簇,j为进行对比的正确聚类结果簇。P(i)为随机挑选一个样本属于实验聚类结果类i的概率,P(j)为随机挑选一个样本属于正确聚类结果类j的概率,P(i,j)为随机挑选一个样本点,既属于类i又属于类j的概率。

    兰德指数大小为0~1,值越大,意味着聚类结果正确率越高,与正确聚类越相近。RI定义式为

    {\rm{RI}} = \frac{{{f_{00}} + {f_{11}}}}{{n(n - 1)/2}} (15)

    其中,{f_{00}}是属于不同标签的样本点个数,{f_{11}}是属于同一标签样本点的个数,n是所有样本点的个数。

    实验 1 离散不一的样本数据集聚类实验 如表1所示的一系列人造样本数据集,从第1个样本集到第10个样本集都由两个2维高斯随机分布样本的类别组成,各类样本中心分别为(5, 5)和(15, 15),类样本数都为50,协方差矩阵其中一类保持[1 0; 0 1]不变,另一类从[1 0; 0 1]变为[10 0; 0 10]。通过协方差矩阵的变化,样本数据集分布变得越来越稀疏,其变化情况如图2所示。在图2中,红色点为第1类数据簇,蓝色点为第2类数据簇,从人造样本数据集1(即图2(a))到人造样本数据集10(即图2(b)),第1类数据簇的疏密分布情况保持不变,第2类数据簇的分布变得越来越稀疏。用FCM和RBI-FCM分别对各样本数据集进行聚类实验,每个样本数据集进行100次聚类试验,计算各样本数据集聚类的NMI平均正确率如图3所示。图3横坐标表示样本数据集序号,纵坐标为对该样本数据集聚类的平均正确率。

    表 1  实验1:人造样本数据集主要参数
    样本集类中心协方差矩阵各类样本数
    1(5, 5), (15, 15)[1 0; 0 1], [1 0; 0 1]50, 50
    2(5, 5), (15, 15)[1 0; 0 1], [2 0; 0 2]50, 50
    \vdots \vdots \vdots \vdots
    10(5, 5), (15, 15)[1 0; 0 1], [10 0; 0 10]50, 50
    下载: 导出CSV 
    | 显示表格
    图 2  人造样本疏密分布数据集
    图 3  聚类结果正确率曲线

    图3聚类结果正确率曲线可见,RBI-FCM算法与FCM算法对类样本松散程度分布都保持一定的敏感度,但在每次试验里,RBI-FCM算法聚类效果略优于传统的FCM算法。

    实验 2 类样本容量差异的数据集聚类实验 如表2所示的一系列人造样本数据集,从第1个样本集到第151个样本集都由两个随机分布样本的类别组成,各类样本点随机分布在一个半径为2的圆内,圆心分别为(5,5)和(10,10),其中一类样本数保持50不变,另一类样本数从50增加到200。通过类样本数的变化,类样本容量差异性不断增强,其分布变化情况如图4所示。在图4中,红色点为第1类数据簇,蓝色点为第2类数据簇,从人造样本数据集1(即图4(a))到人造样本数据集151(即图4(b)),第1类数据簇的样本容量保持50不变,第2类数据簇的样本容量从50增加到200。用FCM和RBI-FCM分别对各样本数据集进行聚类实验,每个样本数据集进行100次聚类试验,计算各数据集聚类的NMI平均正确率如图5所示。图5横坐标表示变化类样本容量数,纵坐标为对该样本数据集聚类的平均正确率。

    表 2  实验2:人造样本数据集主要参数
    样本集样本随机分布的圆心各类样本数
    1(5, 5), (15, 15)50, 50
    2(5, 5), (15, 15)50, 51
    \vdots \vdots   \vdots \vdots
    151(5, 5), (15, 15)50, 200
    下载: 导出CSV 
    | 显示表格
    图 4  人造样本容量分布不均数据集
    图 5  聚类结果正确率曲线

    图5聚类结果准确率曲线图可见,当变化类样本容量达到120左右时,FCM算法开始变得敏感,聚类结果出现较大波动,而RBI-FCM算法受其变化影响较小,依然保持接近百分之百的正确率。当变化类样本容量达到160时,传统的FCM算法基本上完全崩溃,无法正确聚类,RBI-FCM算法开始变得敏感,但在一定情况下也可得较优的聚类结果,受参数\beta '影响较大。根据实验结果,RBI-FCM算法相比传统的FCM算法,对类样本容量差异性有更强的包容性。

    实验 3 类样本非球形分布数据集聚类实验 如图6(a)图6(b)所示的非球形分布人造样本数据集,其中图6(a)样本集包含两类,左边样本类呈圆形分布,右边样本类呈长方形分布;图6(b)样本集包含两类,两类皆呈长方形分布。用FCM和RBI-FCM分别对各样本数据集进行聚类实验,聚类结果如图6(c)图6(f)所示。其中红色点为聚类结果第1类数据簇,蓝色点为聚类结果第2类数据簇。

    图 6  人造非球形样本数据集及聚类结果

    图6聚类效果可见,RBI-FCM算法相比FCM算法对样本数据集分布有更好的包容性,聚类结果上保持更好的聚类稳定性。

    综合上述3个人造样本数据集实验,本文所提RBI-FCM算法能较好对边缘样本进行有效聚类,成功减弱了FCM算法对样本分布不均衡和数据簇分布差异性数据集聚类的敏感度,有较强的鲁棒性。

    本文选取10个UCI数据集进行聚类实验,每个UCI数据集试验100次,并计算RI与NMI平均正确率,RBI-FCM算法与FCM, PFCM和GIFP-FCM算法对比实验结果如表3所示。由聚类结果可发现,RBI-FCM算法相比FCM, PFCM和GIFP-FCM算法,对UCI数据集聚类表现出更为稳健和有效的聚类效果。

    表 3  UCI数据集聚类实验的NMI正确率和RI正确率
    UCI数据集FCMPFCMGIFP-FCMRBI-FCMUCI数据集FCMPFCMGIFP-FCMRBI-FCM
    Auto-mgp0.51900.51670.50080.5443Wine0.41690.41680.39460.4911
    0.75340.75370.75050.78950.71040.71050.67000.7287
    Zoo0.67600.68240.62840.6873Balance Scale0.12230.12320.12930.1326
    0.83810.84000.82360.84640.58870.59000.58060.5947
    Parkinsons0.09260.09360.05260.1071House Votes0.47430.47430.29170.4948
    0.59340.59340.56930.62660.77520.77520.66880.7890
    Credit Approval0.03040.03040.03650.1020Vowel0.30190.31270.33570.3737
    0.50480.50480.52070.54480.77550.79880.82750.8153
    Banknote Authentication0.02920.02920.11450.5249Mammographic Masses0.10540.10650.10200.1130
    0.52360.52360.55550.80530.56760.56830.55240.5746
    注:每个数据集实验结果的第1行为NMI正确率,第2行为RI正确率
    下载: 导出CSV 
    | 显示表格

    传统的FCM算法没有考虑样本的整体分布,受噪声与离群样本的影响较大,无法对边缘样本进行有效界定,体现出较差的聚类鲁棒性。本文通过引入K-means稀疏化特征,降低可靠样本点的模糊性,引入整体散布度,在极小化内部散布度的条件下,考虑不同数据簇之间的可分性,从而提高FCM的泛化性能。由此改进FCM最优化准则,提出RBI-FCM算法。RBI-FCM算法提高了FCM算法的聚类稳定性,加强了FCM算法对数据簇分布差异和抽样不均衡数据集聚类的鲁棒性。同时,在模型求解、算法公式推导上将对超参数{\beta _j}的设置转化为对单一参数\beta '的设置,简化了参数设置的复杂度,并以上一步所得的{\beta _j}求解下一步的{\beta _j},提供了算法设计的新思路。但是,RBI-FCM算法也存在一定的局限性,对于参数\beta '的设置依赖性太强,一个好的聚类结果依赖一个有效的参数\beta '的设置,在实际应用中,还需要对参数\beta '的选取进行理论化的研究。

  • 图  1  聚类结果最大隶属度值曲线分布情况

    图  2  人造样本疏密分布数据集

    图  3  聚类结果正确率曲线

    图  4  人造样本容量分布不均数据集

    图  5  聚类结果正确率曲线

    图  6  人造非球形样本数据集及聚类结果

    表  1  实验1:人造样本数据集主要参数

    样本集类中心协方差矩阵各类样本数
    1(5, 5), (15, 15)[1 0; 0 1], [1 0; 0 1]50, 50
    2(5, 5), (15, 15)[1 0; 0 1], [2 0; 0 2]50, 50
    \vdots \vdots \vdots \vdots
    10(5, 5), (15, 15)[1 0; 0 1], [10 0; 0 10]50, 50
    下载: 导出CSV

    表  2  实验2:人造样本数据集主要参数

    样本集样本随机分布的圆心各类样本数
    1(5, 5), (15, 15)50, 50
    2(5, 5), (15, 15)50, 51
    \vdots \vdots   \vdots \vdots
    151(5, 5), (15, 15)50, 200
    下载: 导出CSV

    表  3  UCI数据集聚类实验的NMI正确率和RI正确率

    UCI数据集FCMPFCMGIFP-FCMRBI-FCMUCI数据集FCMPFCMGIFP-FCMRBI-FCM
    Auto-mgp0.51900.51670.50080.5443Wine0.41690.41680.39460.4911
    0.75340.75370.75050.78950.71040.71050.67000.7287
    Zoo0.67600.68240.62840.6873Balance Scale0.12230.12320.12930.1326
    0.83810.84000.82360.84640.58870.59000.58060.5947
    Parkinsons0.09260.09360.05260.1071House Votes0.47430.47430.29170.4948
    0.59340.59340.56930.62660.77520.77520.66880.7890
    Credit Approval0.03040.03040.03650.1020Vowel0.30190.31270.33570.3737
    0.50480.50480.52070.54480.77550.79880.82750.8153
    Banknote Authentication0.02920.02920.11450.5249Mammographic Masses0.10540.10650.10200.1130
    0.52360.52360.55550.80530.56760.56830.55240.5746
    注:每个数据集实验结果的第1行为NMI正确率,第2行为RI正确率
    下载: 导出CSV
  • 陈新泉, 周灵晶, 刘耀中. 聚类算法研究综述[J]. 集成技术, 2017, 6(3): 41–49. doi: 10.3969/j.issn.2095-3135.2017.03.004

    CHEN Xinquan, ZHOU Lingjing, and LIU Yaozhong. Review on clustering algorithms[J]. Journal of Integrati on Technology, 2017, 6(3): 41–49. doi: 10.3969/j.issn.2095-3135.2017.03.004
    张传锦, 李璐璐. 基于模糊C均值聚类的无线传感器网络节点定位算法[J]. 电子设计工程, 2016, 24(8): 58–60. doi: 10.14022/j.cnki.dzsjgc.2016.08.017

    ZHANG Chuanjin and LI Lulu. Improving multilateration algorithm based on fuzzy C-means cluster in WSN[J]. Electronic Design Engineering, 2016, 24(8): 58–60. doi: 10.14022/j.cnki.dzsjgc.2016.08.017
    池桂英, 王忠华. 基于分层的直觉模糊C均值聚类图像分割算法[J]. 计算机工程与设计, 2017(12): 3368–3373. doi: 10.16208/j.issn1000-7024.2017.12.031

    CHI Guiying and WANG Zhonghua. Intuitionistic fuzzy C-means clustering algorithm based on hierarchy for image segmentation[J]. Computer Engineering and Design, 2017(12): 3368–3373. doi: 10.16208/j.issn1000-7024.2017.12.031
    黄艳国, 罗云鹏. 基于改进模糊C均值聚类算法的城市道路状态判别方法[J]. 科学技术与工程, 2018, 18(9): 335–342. doi: 10.3969/j.issn.1671-1815.2018.09.052

    HUANG Yanguo and LUO Yunpeng. Identification method of urban road condition based on improved fuzzy C-means method clustering algorithm[J]. Science Technology and Engineering, 2018, 18(9): 335–342. doi: 10.3969/j.issn.1671-1815.2018.09.052
    赵泉华, 刘晓燕, 赵雪梅, 等. 基于可变类FCM算法的多光谱遥感影像分割[J]. 电子与信息学报, 2018, 40(1): 157–165. doi: 10.11999/JEIT170397

    ZHAO Quanhua, LIU Xiaoyan, ZHAO Xuemei, et al. Multispectral remote sensing image segmentation based on FCM algorithm with unknown number of clusters[J]. Journal of Electronics &Information Technology, 2018, 40(1): 157–165. doi: 10.11999/JEIT170397
    XU Rui and WUNSCH D. Survey of clustering algorithms[J]. IEEE Transactions on Neural Networks, 2005, 16(3): 645–678. doi: 10.1109/tnn.2005.845141
    陈海鹏, 申铉京, 龙建武, 等. 自动确定聚类个数的模糊聚类算法[J]. 电子学报, 2017, 45(3): 687–694. doi: 10.3969/j.issn.0372-2112.2017.03.028

    CHEN Haipeng, SHEN Xuanjing, LONG Jianwu, et al. Fuzzy clustering algorithm for automatic identification of clusters[J]. Acta Electronica Sinica, 2017, 45(3): 687–694. doi: 10.3969/j.issn.0372-2112.2017.03.028
    YANG MiinShen and NATALIANI Y. Robust-learning fuzzy c-means clustering algorithm with unknown number of clusters[J]. Pattern Recognition, 2017, 71: 45–59. doi: 10.1109/nafips.2010.5548175
    PAL N R, PAL K, KELLER J M, et al. A possibilistic fuzzy C-means clustering algorithm[J]. IEEE Transactions on Fuzzy Systems, 2005, 13(4): 517–530. doi: 10.1109/tfuzz.2004.840099
    肖满生, 肖哲, 文志诚, 等. 一种空间相关性与隶属度平滑的FCM改进算法[J]. 电子与信息学报, 2017, 39(5): 1123–1129. doi: 10.11999/JEIT160710

    XIAO Mansheng, XIAO Zhe, WEN Zhicheng, et al. Improved FCM clustering algorithm based on spatial correlation and membership smoothing[J]. Journal of Electronics &Information Technology, 2017, 39(5): 1123–1129. doi: 10.11999/JEIT160710
    LIU Yun, HOU Tao, and LIU Fu. Improving fuzzy c-means method for unbalanced dataset[J]. Electronics Letters, 2015, 51(23): 1880–1882. doi: 10.1049/el.2015.1541
    史慧峰, 马晓宁. 一种自适应的模糊C均值聚类算法[J]. 无线通信技术, 2016, 25(3): 40–45. doi: 10.3969/j.issn.1003-8329.2016.03.009

    SHI Huifeng and MA Xiaoning. An adaptive fuzzy C-means clustering algorithm[J]. Wireless Communication Technology, 2016, 25(3): 40–45. doi: 10.3969/j.issn.1003-8329.2016.03.009
    曲福恒. 模糊聚类算法及应用[M]. 北京: 国防工业出版社, 2011.

    QU Fuheng. Fuzzy clustering algorithm and its application[M]. Beijing, National Defense Industry Press, 2011.
    DUNN J C. A fuzzy relative of the isodata process and its use in detecting compact well-separated clusters[J]. Journal of Cybernetics, 1974, 3(3): 32–57. doi: 10.1080/01969727308546046
    BEZDEK J C. Pattern Recognition with Fuzzy Objective Function Algorithms[J]. Springer US, 1981. doi: 10.1007/978-1-4757-0450-1
    ZHU Lin, CHUNG FuLai, and WANG Shitong. Generalized fuzzy C-means clustering algorithm with improved fuzzy partitions[J]. IEEE Transactions on Systems Man & Cybernetics Part B Cybernetics A, 2009, 39(3): 578–591. doi: 10.3724/sp.j.1087.2013.02355
    HÖPPNER F and KLAWONN F. Improved fuzzy partitions for fuzzy regression models[J]. International Journal of Approximate Reasoning, 2003, 32(2): 85–102. doi: 10.1016/s0888-613x(02)00078-6
    DENG Zhaohong, CHOI K S, CHUNG Fulai, et al. Enhanced soft subspace clustering integrating within-cluster and between-cluster information[J]. Pattern Recognition, 2010, 43(3): 767–781. doi: 10.1016/j.patcog.2009.09.010
  • 期刊类型引用(9)

    1. 覃小素,黄成泉,彭家磊,陈阳,雷欢,周丽华. 基于空间信息的鲁棒模糊C均值聚类的苗族服饰图像分割算法. 毛纺科技. 2024(01): 91-98 . 百度学术
    2. 陈阳,黄成泉,雷欢,彭家磊,覃小素,周丽华. 加权可靠性FCOM算法的苗族服饰图像分割. 工业控制计算机. 2024(04): 61-63 . 百度学术
    3. 覃小素,黄成泉,雷欢,陈阳,彭家磊,周丽华. 可靠性模糊局部信息C均值聚类算法的苗族服饰图像分割. 智能计算机与应用. 2023(10): 142-146 . 百度学术
    4. 雷欢,黄成泉,陈阳,覃小素,彭家磊. 广义增强区间二型FCM的苗族服饰图像分割算法. 北京邮电大学学报. 2023(06): 95-101 . 百度学术
    5. 朱占龙 ,刘明 ,李亚梅 ,赵冬梅 . 对类差异不敏感的模糊C均值图像分割. 华中科技大学学报(自然科学版). 2022(03): 43-48+73 . 百度学术
    6. 潘金艳,高朋,高云龙,谢有为,熊裕慧. 基于可靠性的鲁棒模糊聚类. 控制理论与应用. 2021(04): 516-528 . 百度学术
    7. 王博,谢军伟,张晶,葛佳昂. 低快拍下基于RBF的CSB sin-FDA稳健波束形成. 振动与冲击. 2020(06): 117-124 . 百度学术
    8. 焦玮,杨雪寒,孟洁,张倩. 针对电子医疗档案的数据分析. 微型电脑应用. 2020(09): 32-35 . 百度学术
    9. 蒋亦樟,华蕾,张群,钱鹏江,夏开建. 多任务模糊聚类驱动的多任务TSK模糊系统模型. 应用科学学报. 2020(05): 742-760 . 百度学术

    其他类型引用(13)

  • 加载中
图(6) / 表(3)
计量
  • 文章访问数:  2309
  • HTML全文浏览量:  934
  • PDF下载量:  92
  • 被引次数: 22
出版历程
  • 收稿日期:  2018-06-20
  • 修回日期:  2018-12-24
  • 网络出版日期:  2018-12-28
  • 刊出日期:  2019-05-01

目录

/

返回文章
返回