高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

孤立点一类支持向量机算法研究

田江 顾宏

田江, 顾宏. 孤立点一类支持向量机算法研究[J]. 电子与信息学报, 2010, 32(6): 1284-1288. doi: 10.3724/SP.J.1146.2009.00861
引用本文: 田江, 顾宏. 孤立点一类支持向量机算法研究[J]. 电子与信息学报, 2010, 32(6): 1284-1288. doi: 10.3724/SP.J.1146.2009.00861
Tian Jiang, Gu Hong. Outlier One Class Support Vector Machines[J]. Journal of Electronics & Information Technology, 2010, 32(6): 1284-1288. doi: 10.3724/SP.J.1146.2009.00861
Citation: Tian Jiang, Gu Hong. Outlier One Class Support Vector Machines[J]. Journal of Electronics & Information Technology, 2010, 32(6): 1284-1288. doi: 10.3724/SP.J.1146.2009.00861

孤立点一类支持向量机算法研究

doi: 10.3724/SP.J.1146.2009.00861

Outlier One Class Support Vector Machines

  • 摘要: 一类支持向量机将数据样本映射到高维空间,通过与坐标原点保持最大间隔的特征超平面检测孤立点。实际应用中算法对坐标原点的选择依赖性较强,检测性能受数据样本的分布影响较大;将算法转化为求解二类问题在一定程度上克服了这些不足,但其带来的数据不平衡问题受到现实中孤立点样本稀少或者不存在的影响。该文提出了孤立点一类支持向量机算法,并在此基础上设计了一种无监督的孤立点检测方法。分别基于超平面距离和概率输出大小定义两种孤立点异常程度,设定不同权值合并两种异常程度输出,将获得的可疑孤立点特征信息引入算法;在特征空间划分距离可疑孤立点最大间隔的超平面,分析在全部样本上的预测输出大小进而交互更新两部分的数据样本。在UCI数据集上进行了仿真实验,数据结果表明了该文方法能有效的提高检测率,降低误报率;同时样本交叉更新提高了检测的稳定性。
  • Han J and Kamber M. Data Mining: Concepts and Techniques[M]. San Francisco: Morgan Kaufmann Publishers, 2006: 451-458.[2]倪巍伟, 陈耿, 陆介平, 吴英杰, 孙志挥. 基于局部信息熵的加权子空间孤立点检测算法[J].计算机研究与发展, 2008, 45(7): 1189-1194.Ni W W, Chen G, Lu J P, Wu Y J, and Sun Z H. Local entropy based weighted subspace outlier mining algorithm[J]. Journal of Computer Research and Development, 2008, 45(7): 1189-1194.[3]薛安荣, 鞠时光, 何伟华, 陈伟鹤. 局部孤立点挖掘算法研究[J]. 计算机学报, 2007, 30(8): 1455-1463.Xue A R, Ju S G, He W H, and Chen W H. Study on algorithms for local outlier detection[J]. Chinese Journal of Computers, 2007, 30(8): 1455-1463.[4]庞彦伟, 刘政凯. 一种自动抑制孤立点的子空间学习方法[J].电子与信息学报.2008, 30(1):176-179浏览Pang Y W and Liu Z K. Automatically outlier-resisting subspace learning[J]. Journal of Electronics and Information Technology, 2008, 30(1): 176-179.[5]Giacinto G, Perdisci R, Del Rio M, and Roli F. Intrusion detection in computer networks by a modular ensemble of one-class classifiers[J].Information Fusion.2008, 9(1):69-82[6]Chandola V, Banerjee A, and Kumar V. Anomaly detection: A survey[J]. ACM Computing Survey, 2009, 41(3): 1-58.[7]Scholkopf B, Williamson R C, Smola A J, Shawe-Taylor J, and Platt J. Support vector method for novelty detection[J]. Advances in Neural Information Processing Systems,2000,12(3): 582-588.[8]Scholkopf B, Platt J C, Shawe-Taylor J, Smola A J, and Williamson R C. Estimating the support of a high-dimensional distribution[J].Neural Computation.2001, 13(7):1443-1471[9]Eskin E, Arnold A, Prerau M, Portnoy L, and Stolfo S. Applications of Data Mining in Computer Security[M]. Norwell Massachusetts:Kluwer Academic Publishers, 2002: 77-87.[10]Manevitz L M and Yousef M. One-class SVMs for document classification[J].Journal of Machine Learning Research.2002, 2(2):139-154[11]He J R, Li M J, Li Z W, Zhang H J, Tong H H, and Zhang C S. Pseudo relevance feedback based on iterative probabilistic one-class SVMs in web image retrieval, In: Advances in Multimedia Information Processing - Pcm 2004, Pt 2, Proceedings[C]. Lecture Notes in Computer Science, 2004, 3332: 213-220.[12]Scholkopf B, Platt J, and Smola A J. Kernel method for percentile feature extraction[R]. Microsoft Research Ltd, 2000.[13]Munoz A and Moguerza J M. Estimation of high-density regions using one-class neighbor machines[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.2006, 28(3):476-480
  • 加载中
计量
  • 文章访问数:  3568
  • HTML全文浏览量:  105
  • PDF下载量:  1682
  • 被引次数: 0
出版历程
  • 收稿日期:  2009-06-09
  • 修回日期:  2009-10-16
  • 刊出日期:  2010-06-19

目录

    /

    返回文章
    返回