高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于EMD拟合特征的耳语音端点检测

潘欣裕 赵鹤鸣 陈雪勤 徐敏

潘欣裕, 赵鹤鸣, 陈雪勤, 徐敏. 基于EMD拟合特征的耳语音端点检测[J]. 电子与信息学报, 2008, 30(2): 362-366. doi: 10.3724/SP.J.1146.2006.01021
引用本文: 潘欣裕, 赵鹤鸣, 陈雪勤, 徐敏. 基于EMD拟合特征的耳语音端点检测[J]. 电子与信息学报, 2008, 30(2): 362-366. doi: 10.3724/SP.J.1146.2006.01021
Pan Xin-yu, Zhao He-ming, Chen Xue-qin, Xu Min . Endpoint Detection of Whispers Based on the Fitting Characteristic of EMD[J]. Journal of Electronics & Information Technology, 2008, 30(2): 362-366. doi: 10.3724/SP.J.1146.2006.01021
Citation: Pan Xin-yu, Zhao He-ming, Chen Xue-qin, Xu Min . Endpoint Detection of Whispers Based on the Fitting Characteristic of EMD[J]. Journal of Electronics & Information Technology, 2008, 30(2): 362-366. doi: 10.3724/SP.J.1146.2006.01021

基于EMD拟合特征的耳语音端点检测

doi: 10.3724/SP.J.1146.2006.01021
基金项目: 

国家自然科学基金(60572076)资助课题

Endpoint Detection of Whispers Based on the Fitting Characteristic of EMD

  • 摘要: 耳语音作为人类发音的一种特殊形式,与正常语音相比具有信噪比低、元音的周期特征不明显等特性,因而耳语音处理比正常语音更为困难。耳语音处理研究的第1个关键步骤就是语音的端点检测,该文利用希尔伯特-黄变换(Hilbert-Huang Transform, HHT)中的经验模态分解(Empirical Mode Decomposition, EMD),首次提出了一种基于EMD拟合特征的耳语音端点检测新方法。利用EMD得到的内禀模态函数(Intrinsic Mode Function, IMF)能量,以其归一化拟合参数为耳语音端点检测的特征,可以准确地划分出耳语音端点。实验表明,该方法在耳语音端点检测中取得了很好的效果,在1200个信噪比为2~10dB的测试样本中,检测准确率为98.25%。
  • 陈四根, 和应民. 一种基于信息熵的语音端点检测方法 [J].应用科技, 2001, 28(3): 13-14.Chen S G and He Y M. A scheme of speech endpointdetection based on information entropy [J]. Applied Scienceand Technology, 2001, 28(3): 13-14.[2]Drouiche K, Gomez P, Alvarez A, Martinez R, Rodellar V,and Nieto V. A spectral distance measure for speechdetection in noise and speech segmentation [C]. Proceedingsof the 11th IEEE Signal Processing Workshop on StatisticalSignal Processing, Singapore, 2001: 500-503.[3]Chen S H, Liao Y F, and Chiang S M, et al.. An RNN-basedpre-classification method for fast continuous mandarinspeech recognition [J].IEEE Trans. on Speech and AudioProcessing.1998, 6(1):86-90[4]Robert W M and Mark A C. Reconstruction of speech fromwhispers [J].Medical Engineering Physics.2002, 24(8):515-520[5]栗学丽, 丁慧, 徐柏龄. 基于熵函数的耳语音声韵分割法 [J].声学学报, 2005, 30(1): 69-75.Li X L, Ding H, and Xu B L. Entropy-based initial/finalsegmentation for Chinese whispered speech [J]. ActaAcoustica, 2005, 30(1): 69-75.[6]Liu Z F, Liao Z P, and Sang E F. Speech enhancement basedon Hilbert-Huang transform [C]. Proceedings of 2005International Conference on Machine Learning andCybernetics, Guangzhou, China, 2005, 8: 4908-4912.[7]杨莉莉, 李燕, 徐柏龄. 汉语耳语音库的建立与听觉实验研究[J]. 南京大学学报(自然科学), 2005, 41(3): 311-317.Yang L L, Li Y, and Xu B L. The establishment of a Chinesewhisper database and perceptual experiment [J]. Journal ofNanjing University (Natural Sciences), 2005, 41(3): 311-317.[8]吴宗济,林茂灿主编. 实验语音学概要[M]. 北京: 高等教育出版社, 1989: 112-152.Wu Z J and Lin M C. Experiment Phonetics [M]. Beijing:Higher Education Press, 1989: 112-152.
  • 加载中
计量
  • 文章访问数:  3190
  • HTML全文浏览量:  60
  • PDF下载量:  1067
  • 被引次数: 0
出版历程
  • 收稿日期:  2006-07-10
  • 修回日期:  2007-01-12
  • 刊出日期:  2008-02-19

目录

    /

    返回文章
    返回