基于特征均值距离的短语音段说话人聚类算法
doi: 10.3724/SP.J.1146.2011.01139
Feature Mean Distance Based Speaker Clustering for Short Speech Segments
-
摘要: 该文提出一种基于特征均值距离的短语音段说话人聚类算法。首先,定义特征均值距离用来在特征层而不是模型层刻画两个类之间的相似度;然后,迭代合并特征均值距离最小的两个类,直到任意两类之间的特征均值距离的最小值大于一个自适应门限为止。采用取自两个语音数据库的短于3 s的语音段进行实验测试,结果表明:与基于AHC+BIC的算法相比,F度量值平均提高了5%,运算速度约为以前算法的4.68倍。Abstract: An algorithm of speaker clustering is proposed based on Feature Mean Distance (FMD) for short speech segments. First, a distance measure, i.e. FMD, is introduced to represent the similarities between two clusters on the level of feature instead of the level of model. Then, two clusters with the minimum of FMDs are iteratively merged until the minimum of FMDs is larger than an adaptive threshold. Experimental results show average 5% improvements in F measure are obtained in comparison with the AHC+BIC based algorithm. In addition, the proposed algorithm is 4.68 times faster than the AHC+BIC based algorithm.
期刊类型引用(11)
1. 魏政磊,董康生,段耀泽,陈蔚,岑飞,周欢. 融合分割点检测的在线机动轨迹识别方法. 哈尔滨工业大学学报. 2024(12): 20-33 . 百度学术
2. 魏政磊,丁达理,黄康强,黄长强. 基于时序分析的近距空战数据知识提取及应用. 指挥与控制学报. 2022(01): 80-89 . 百度学术
3. 杨辰,王楚涵,陶琬莹,耿爽. 基于专利的技术机会识别:深度学习领域的案例分析. 科技管理研究. 2021(12): 172-176 . 百度学术
4. 张睿恺,吴克河. 基于优化特征集的LeNet-5攻击检测模型的态势感知技术. 计算机应用研究. 2020(S1): 287-289 . 百度学术
5. 刘月峰,王成,张亚斌,苑江浩. 面向网络入侵检测系统的深度卷积神经网络模型. 内蒙古科技大学学报. 2018(01): 59-64 . 百度学术
6. 张翼. 网络入侵与应对技术初探. 电子测试. 2016(06): 89+83 . 百度学术
7. 康松林,刘乐,刘楚楚,廖锓. 多层极限学习机在入侵检测中的应用. 计算机应用. 2015(09): 2513-2518 . 百度学术
8. 张震,李玉峰,王晶,兰巨龙. 基于复杂网络挖掘的用户行为感知机制. 中国科学:信息科学. 2014(09): 1069-1083 . 百度学术
9. 冶晓隆,兰巨龙,郭通. 基于主成分分析禁忌搜索和决策树分类的异常流量检测方法. 计算机应用. 2013(10): 2846-2850+2944 . 百度学术
10. 程国振,程东年,俞定玖. 基于多尺度低秩模型的网络异常流量检测方法. 通信学报. 2012(01): 182-190 . 百度学术
11. 张勇,张卫民,欧庆于. 基于主动学习的计算机病毒检测方法研究. 计算机与数字工程. 2011(11): 89-93+105 . 百度学术
其他类型引用(12)
-
计量
- 文章访问数: 2812
- HTML全文浏览量: 184
- PDF下载量: 983
- 被引次数: 23