基于特征均值距离的短语音段说话人聚类算法

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于特征均值距离的短语音段说话人聚类算法

李艳雄, 吴永, 贺前华

文章导航 > 电子与信息学报 > 2012 > 34(6): 1404-1407

李艳雄, 吴永, 贺前华. 基于特征均值距离的短语音段说话人聚类算法[J]. 电子与信息学报, 2012, 34(6): 1404-1407. doi: 10.3724/SP.J.1146.2011.01139

引用本文:

李艳雄, 吴永, 贺前华. 基于特征均值距离的短语音段说话人聚类算法[J]. 电子与信息学报, 2012, 34(6): 1404-1407. doi: 10.3724/SP.J.1146.2011.01139

Li Yan-Xiong, Wu Yong, He Qian-Hua. Feature Mean Distance Based Speaker Clustering for Short Speech Segments[J]. Journal of Electronics & Information Technology, 2012, 34(6): 1404-1407. doi: 10.3724/SP.J.1146.2011.01139

Citation:

Li Yan-Xiong, Wu Yong, He Qian-Hua. Feature Mean Distance Based Speaker Clustering for Short Speech Segments[J]. Journal of Electronics & Information Technology, 2012, 34(6): 1404-1407. doi: 10.3724/SP.J.1146.2011.01139

李艳雄, 吴永, 贺前华. 基于特征均值距离的短语音段说话人聚类算法[J]. 电子与信息学报, 2012, 34(6): 1404-1407. doi: 10.3724/SP.J.1146.2011.01139

引用本文:

李艳雄, 吴永, 贺前华. 基于特征均值距离的短语音段说话人聚类算法[J]. 电子与信息学报, 2012, 34(6): 1404-1407. doi: 10.3724/SP.J.1146.2011.01139

Li Yan-Xiong, Wu Yong, He Qian-Hua. Feature Mean Distance Based Speaker Clustering for Short Speech Segments[J]. Journal of Electronics & Information Technology, 2012, 34(6): 1404-1407. doi: 10.3724/SP.J.1146.2011.01139

Citation:

Li Yan-Xiong, Wu Yong, He Qian-Hua. Feature Mean Distance Based Speaker Clustering for Short Speech Segments[J]. Journal of Electronics & Information Technology, 2012, 34(6): 1404-1407. doi: 10.3724/SP.J.1146.2011.01139

基于特征均值距离的短语音段说话人聚类算法

doi: 10.3724/SP.J.1146.2011.01139 cstr: 32379.14.SP.J.1146.2011.01139

李艳雄^{* 吴永贺前华,},
吴永,
贺前华

基金项目:

国家自然科学基金(61101160, 60972132)，中央高校基本科研业务费专项基金(2011ZM0029)和广东省自然科学基金博士启动项目(10451064101004651)资助课题

计量
- 文章访问数: 2877
- HTML全文浏览量: 205
- PDF下载量: 984
- 被引次数: 0
出版历程
- 收稿日期: 2011-11-03
- 修回日期: 2012-02-24
- 刊出日期: 2012-06-19

Feature Mean Distance Based Speaker Clustering for Short Speech Segments

Li Yan-Xiong^{* 吴永贺前华
,},
Wu Yong,
He Qian-Hua

摘要: 该文提出一种基于特征均值距离的短语音段说话人聚类算法。首先，定义特征均值距离用来在特征层而不是模型层刻画两个类之间的相似度；然后，迭代合并特征均值距离最小的两个类，直到任意两类之间的特征均值距离的最小值大于一个自适应门限为止。采用取自两个语音数据库的短于3 s的语音段进行实验测试，结果表明：与基于AHC+BIC的算法相比，F度量值平均提高了5%，运算速度约为以前算法的4.68倍。
- 语音信号处理 /
- 说话人聚类 /
- 特征均值距离 /
- 短语音段
Abstract: An algorithm of speaker clustering is proposed based on Feature Mean Distance (FMD) for short speech segments. First, a distance measure, i.e. FMD, is introduced to represent the similarities between two clusters on the level of feature instead of the level of model. Then, two clusters with the minimum of FMDs are iteratively merged until the minimum of FMDs is larger than an adaptive threshold. Experimental results show average 5% improvements in F measure are obtained in comparison with the AHC+BIC based algorithm. In addition, the proposed algorithm is 4.68 times faster than the AHC+BIC based algorithm.
- Speech signal processing /
- Speaker clustering /
- Feature Mean Distance (FMD) /
- Short speech segments

参考文献(0)

资源附件(0)

计量

文章访问数: 2877
HTML全文浏览量: 205
PDF下载量: 984
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回