高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种集成式Beta过程最大间隔一类分类方法

张维 杜兰

张维, 杜兰. 一种集成式Beta过程最大间隔一类分类方法[J]. 电子与信息学报, 2021, 43(5): 1219-1227. doi: 10.11999/JEIT200080
引用本文: 张维, 杜兰. 一种集成式Beta过程最大间隔一类分类方法[J]. 电子与信息学报, 2021, 43(5): 1219-1227. doi: 10.11999/JEIT200080
Wei ZHANG, Lan DU. An Ensembling One-class Classification Method Based on Beta Process Max-margin One-class Classifier[J]. Journal of Electronics & Information Technology, 2021, 43(5): 1219-1227. doi: 10.11999/JEIT200080
Citation: Wei ZHANG, Lan DU. An Ensembling One-class Classification Method Based on Beta Process Max-margin One-class Classifier[J]. Journal of Electronics & Information Technology, 2021, 43(5): 1219-1227. doi: 10.11999/JEIT200080

一种集成式Beta过程最大间隔一类分类方法

doi: 10.11999/JEIT200080
基金项目: 国家自然科学基金(61771362),高等学校学科创新引智计划(B18039),陕西省重点科技创新团队计划
详细信息
    作者简介:

    张维:男,1992年生,博士生,研究方向为机器学习及其在雷达目标识别方面的应用

    杜兰:女,1980年生,教授,博士生导师,研究方向为统计信号处理、雷达信号处理、机器学习及其在雷达目标检测与识别方面的应用

    通讯作者:

    杜兰 dulan@mail.xidian.edu.cn

  • 中图分类号: TN957.51

An Ensembling One-class Classification Method Based on Beta Process Max-margin One-class Classifier

Funds: The National Natural Science Foundation of China (61771362), The 111 Project (B18039), Shaanxi Innovation Team Project
  • 摘要: 一类分类是一种将目标类样本和其他所有的非目标类样本区分开的分类方法。传统的一类分类方法针对所有训练样本建立一个分类器,忽视了数据的内在结构,在样本分布复杂时,其分类性能会严重下降。为了提升复杂分布情况下的分类性能,该文提出一种集成式Beta过程最大间隔一类方法。该方法利用Dirichlet过程混合模型(DPM)对训练样本聚类,同时在每一个聚类学习一个Beta过程最大间隔一类分类器。通过多个分类器的集成,可以构造出一个描述能力更强的分类器,提升复杂分布下的分类效果。DPM聚类模型和Beta过程最大间隔一类分类器在同一个贝叶斯框架下联合优化,保证了每一个聚类样本的可分性。此外,在Beta过程最大间隔一类分类器中,加入了服从Beta过程先验分布的特征选择因子,从而可以降低特征冗余度以及提升分类效果。基于仿真数据、公共数据集和实测SAR图像数据的实验结果证明了所提方法的有效性。
  • 图  1  集成式Beta过程最大间隔一类分类器的概率图模型

    图  2  集成式Beta过程最大间隔一类分类器流程图

    图  3  训练样本2维分布图

    图  4  聚类结果和每个聚类鉴别界面可视图

    图  5  CFAR之后的一些目标和杂波切片示例

    图  6  Australia数据集上分类正确率随超参数${T_{{\rm{burn - in}}}}$, ${T_{{\rm{num}}}}$${T_{{\rm{space}}}}$的变化曲线图

    图  7  不同$\alpha $取值下的测试分类正确率变化曲线

    图  8  不同和${a_0}$${b_0}$取值下,本文方法在Australia数据集的测试分类正确率曲线

    表  1  实验所用公共数据集介绍

    数据集类别数目标类别特征维度训练样本数测试目标样本数测试非目标样本数
    Australia21142159292
    Landsat64, 5, 6365004181082
    Waveform31, 22133116521696
    Pageblocks511024562457560
    下载: 导出CSV

    表  2  不同方法在Waveform数据集上的3个指标平均值(%)

    指标L-SVDDKOCSVMK-meansPCAMSTSOMAEMPMLPDDEn-MMOCC本文方法
    准确率57.0564.1466.9455.2661.1967.7458.0072.4474.2575.9277.22
    F1分数67.1259.9471.9266.1870.7068.3056.4065.6671.0274.1275.11
    AUC71.1969.6376.7159.5073.5773.8361.2683.9882.0183.6785.00
    下载: 导出CSV

    表  3  不同方法在Landsat数据集上的3个指标平均值 (%)

    指标L-SVDDKOCSVMK-meansPCAMSTSOMAEMPMLPDDEn-MMOCC本文方法
    准确率79.7285.9882.4071.2873.2680.0686.0185.0486.9288.0690.30
    F1分数71.2573.2573.7663.2765.8670.2971.8469.9574.5477.8781.79
    AUC91.5490.8892.7280.1187.2587.7692.3589.9691.6992.2194.18
    下载: 导出CSV

    表  4  不同方法在Australia数据集上的3个指标平均值 (%)

    指标L-SVDDKOCSVMK-meansPCAMSTSOMAEMPMLPDDEn-MMOCC本文方法
    准确率55.4170.7669.2966.0656.4161.1478.6181.9067.9981.4182.21
    F1分数66.6767.4474.6972.1367.9967.3377.6575.1867.5480.3681.71
    AUC74.4273.8482.5378.3266.2367.8483.1480.7371.7382.5784.16
    下载: 导出CSV

    表  5  不同方法在Pageblocks数据集上的3个指标平均值 (%)

    指标L-SVDDKOCSVMK-meansPCAMSTSOMAEMPMLPDDEn-MMOCC本文方法
    准确率89.6390.6990.0689.2390.1989.7990.0687.7490.0991.0592.21
    F1分数93.3693.9193.7393.1793.9593.5093.6794.1793.7294.1595.22
    AUC95.6995.9995.7394.6890.0295.8495.6996.0095.2294.9996.03
    下载: 导出CSV

    表  6  不同方法在实测SAR数据集上的3个指标平均值 (%)

    指标L-SVDDKOCSVMK-meansPCAMSTSOMAEMPMLPDDEn-MMOCC本文方法
    准确率82.1484.7284.8273.8384.1380.2383.4284.6783.2485.7786.12
    F1分数85.0587.8686.9779.1187.0582.3185.9886.8585.1188.0088.52
    AUC87.3088.1888.4677.9989.0889.0587.6589.0888.3688.3589.59
    下载: 导出CSV

    表  7  不同一类分类方法所需的计算时间(s)

    数据集L-SVDDKOCSVMK-meansPCAMSTSOMAEMPMLPDD本文方法
    Australia训练0.5100.8280.2900.4480.48923.08621.0110.3471.12237.432
    测试0.0970.2520.0240.0130.0490.0230.2770.0260.1870.535
    Landsat训练1.5721.8220.3630.5122.934122.611530.9211.17610.177531.735
    测试0.4110.5130.1200.1003.3490.10922.3620.2327.4525.323
    下载: 导出CSV
  • [1] TAX D M J. One-class classification: Concept-learning in the absence of counter-examples[D]. [Ph. D. dissertation], Delft University of Technology, 2001: 13–19.
    [2] 王布宏, 罗鹏, 李腾耀, 等. 基于粒子群优化多核支持向量数据描述的广播式自动相关监视异常数据检测模型[J]. 电子与信息学报, 2020, 42(11): 2727–2734. doi: 10.11999/JEIT190767

    WANG Buhong, LUO Peng, LI Tengyao, et al. ADS-B anomalous data detection model based on PSO-MKSVDD[J]. Journal of Electronics &Information Technology, 2020, 42(11): 2727–2734. doi: 10.11999/JEIT190767
    [3] 王宝帅, 兰竹, 李正杰, 等. 毫米波雷达机场跑道异物分层检测算法[J]. 电子与信息学报, 2018, 40(11): 2676–2683. doi: 10.11999/JEIT180200

    WANG Baoshuai, LAN Zhu, LI Zhengjie, et al. A hierarchical foreign object debris detection method using millimeter wave radar[J]. Journal of Electronics &Information Technology, 2018, 40(11): 2676–2683. doi: 10.11999/JEIT180200
    [4] 董书琴, 张斌. 基于深度特征学习的网络流量异常检测方法[J]. 电子与信息学报, 2020, 42(3): 695–703. doi: 10.11999/JEIT190266

    DONG Shuqin and ZHANG Bin. Network traffic anomaly detection method based on deep features learning[J]. Journal of Electronics &Information Technology, 2020, 42(3): 695–703. doi: 10.11999/JEIT190266
    [5] 陈莹, 何丹丹. 基于贝叶斯融合的时空流异常行为检测模型[J]. 电子与信息学报, 2019, 41(5): 1137–1144. doi: 10.11999/JEIT180429

    CHEN Ying, HE Dandan. Spatial-temporal stream anomaly detection based on Bayesian fusion[J]. Journal of Electronics &Information Technology, 2019, 41(5): 1137–1144. doi: 10.11999/JEIT180429
    [6] 王威丽, 陈前斌, 唐伦. 虚拟网络切片中的在线异常检测算法研究[J]. 电子与信息学报, 2020, 42(6): 1460–1467. doi: 10.11999/JEIT190531

    WANG Weili, CHEN Qianbin, and TANG Lun. Online anomaly detection for virtualized network slicing[J]. Journal of Electronics &Information Technology, 2020, 42(6): 1460–1467. doi: 10.11999/JEIT190531
    [7] 孟令博, 耿修瑞. 基于协峭度张量的高光谱图像异常检测[J]. 电子与信息学报, 2019, 41(1): 150–155. doi: 10.11999/JEIT180280

    MENG Lingbo and GENG Xiurui. A hyperspectral imagery anomaly detection algorithm based on cokurtosis tensor[J]. Journal of Electronics &Information Technology, 2019, 41(1): 150–155. doi: 10.11999/JEIT180280
    [8] PIMENTEL M A F, CLIFTON D A, CLIFTON L, et al. A review of novelty detection[J]. Signal Processing, 2014, 99: 215–249. doi: 10.1016/j.sigpro.2013.12.026
    [9] LAMPARIELLO F and SCIANDRONE M. Efficient training of RBF neural networks for pattern recognition[J]. IEEE Transactions on Neural Networks, 2001, 12(5): 1235–1242. doi: 10.1109/72.950152
    [10] SCHOLKOPF B and SMOLA A J. Learning with Kernels[M]. Cambridge: MIT Press, 2001: 469–513.
    [11] TAX D M J and DUIN R P W. Support vector domain description[J]. Pattern Recognition Letters, 1999, 20(11/13): 1191–1199. doi: 10.1016/s0167-8655(99)00087-2
    [12] FERGUSON T S. A Bayesian analysis of some nonparametric problems[J]. Annals of Statistics, 1973, 1(2): 209–230. doi: 10.1214/aos/1176342360
    [13] BLEI D M and JORDAN M I. Variational inference for Dirichlet process mixtures[J]. Bayesian Analysis, 2006, 1(1): 121–143. doi: 10.1214/06-BA104
    [14] SOLLICH P. Bayesian methods for support vector machines: Evidence and predictive class probabilities[J]. Machine Learning, 2002, 46(1–3): 21–52. doi: 10.1023/a:1012489924661
    [15] POLSON N G and SCOTT S L. Data augmentation for support vector machines[J]. Bayesian Analysis, 2011, 6(1): 1–23. doi: 10.1214/11-BA601
    [16] GEMAN S and GEMAN D. Stochastic relaxation, Gibbs distributions, and the Bayesian restoration of images[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1984, PAMI-6(6): 721–741. doi: 10.1109/TPAMI.1984.4767596
    [17] WOLD S, ESBENSEN K, and GELADI P. Principal component analysis[J]. Chemometrics and Intelligent Laboratory Systems, 1987, 2(1/3): 37–52. doi: 10.1016/0169-7439(87)80084-9
    [18] JUSZCZAK P, TAX D M J, PE¸KALSKA E, et al. Minimum spanning tree based one-class classifier[J]. Neurocomputing, 2009, 72(7/9): 1859–1869. doi: 10.1016/j.neucom.2008.05.003
    [19] KOHONEN T and SOMERVUO P. Self-organizing maps of symbol strings[J]. Neurocomputing, 1998, 21(1/3): 19–30. doi: 10.1016/s0925-2312(98)00031-9
    [20] LANCKRIET G R G, EL GHAOUI L, and JORDAN M I. Robust novelty detection with single-class MPM[C]. The 15th International Conference on Neural Information Processing Systems, Vancouver, British Columbia, Canada, 2002: 929–936.
    [21] PĘKALSKA E, TAX D M J, and DUIN R P W. One-class LP classifier for dissimilarity representations[C]. Proceedings of the 15th International Conference on Neural Information Processing Systems, British Columbia, Canada, 2002: 777–784.
    [22] DUNSON D B and PARK J H. Kernel stick-breaking processes[J]. Biometrika, 2008, 95(2): 307–323. doi: 10.1093/biomet/asn012
    [23] KRUSCHKE J K. Bayesian data analysis[J]. Wiley Interdisciplinary Reviews: Cognitive Science, 2010, 1(5): 658–676. doi: 10.1002/wcs.72
  • 加载中
图(8) / 表(7)
计量
  • 文章访问数:  780
  • HTML全文浏览量:  355
  • PDF下载量:  56
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-01-19
  • 修回日期:  2020-11-12
  • 网络出版日期:  2020-11-18
  • 刊出日期:  2021-05-18

目录

    /

    返回文章
    返回