高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种基于GA的混合属性特征大数据集聚类算法

李洁 高新波 焦李成

李洁, 高新波, 焦李成. 一种基于GA的混合属性特征大数据集聚类算法[J]. 电子与信息学报, 2004, 26(8): 1203-1209.
引用本文: 李洁, 高新波, 焦李成. 一种基于GA的混合属性特征大数据集聚类算法[J]. 电子与信息学报, 2004, 26(8): 1203-1209.
Li Jie, Gao Xin-bo, Jiao Li-cheng. A GA-Based Clustering Algorithm for Large Data Sets with Mixed Numerical and Categorical Values[J]. Journal of Electronics & Information Technology, 2004, 26(8): 1203-1209.
Citation: Li Jie, Gao Xin-bo, Jiao Li-cheng. A GA-Based Clustering Algorithm for Large Data Sets with Mixed Numerical and Categorical Values[J]. Journal of Electronics & Information Technology, 2004, 26(8): 1203-1209.

一种基于GA的混合属性特征大数据集聚类算法

A GA-Based Clustering Algorithm for Large Data Sets with Mixed Numerical and Categorical Values

  • 摘要: 在数据挖掘中,经常会遇到和分析大量具有数值和类属特征的数据。然而,现有的大多数算法只能单独处理数值特征数据或类属特征数据,而不能分析具有混合属性的数据。为此,该文提出了一种基于GA的模糊聚类新算法,通过改进聚类目标函数将数值特征与类属特征相结合,从而实现具有混合属性特征数据的聚类分析;通过引入GA算法能够快速得到全局最优解,而且不依赖于原型初始化。实验结果表明,基于GA的新聚类算法对于处理具有混合特征的大数据集聚类问题是相当有效的。
  • Klosgen W,Zytkow J M.Knowledge Discovery in Databases Terminology.Advances in Knowledge Discovery and Data Mining,Fayyad U M,Piatetsky-Shapiro G,Smyth P,Uthurusamy R.(Eds.),AAAI Press/The MIT Press,MA,1996:573-592.[2]Cormack R M.A review of classification[J].J.Roy.Statist.Soc.Series A.1971,134:321-367[3]IBM.Data Management Solutions.IBM White Paper,IBM Corp.1996.[4]Anderberg M B.Cluster Analysis for Applications.New York:Academic Press.1973:79-90.[5]Kaufman L,Rousseeuw P J.Finding Groups in Data-An Introduction to Cluster Analysis.New York:John Wiley,1990:98-110.[6]Everitt B.Cluster Analysis.New York:Heinemann Educational Books Ltd.,1974:45-60.[7]Huang Zhexue,Michael K N.A fuzzy k-modes algorithm for clustering categorical data[J].IEEE Trans.on Fuzzy Systems.1999,7(4):446-452[8]Zhexue Huang.A fast clustering algorithm to cluster very large categorical data sets in data mining.Proceedings of the SIGMOD Workshop on Research Issues on Data Mining and Knowledge Discovery,Dept.of Computer Science,The University of British Columbia,Canada,1997:1-8.[9]Holland J H.Adoption in Natural and Artificial System.Ann Arbor,MI:Univ.Mich.Press,1975:83-90.[10]Krovi R.Genetic algorithm for clustering:A preliminary investigation.Proceedings of the 25th Hawaii International Conf.on System Sciences,4,Information Systems,Hawaii,1992:504-544.
  • 加载中
计量
  • 文章访问数:  2887
  • HTML全文浏览量:  103
  • PDF下载量:  972
  • 被引次数: 0
出版历程
  • 收稿日期:  2003-03-27
  • 修回日期:  2003-07-08
  • 刊出日期:  2004-08-19

目录

    /

    返回文章
    返回