高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用

王作英 孙健

王作英, 孙健. 一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用[J]. 电子与信息学报, 2007, 29(4): 867-869. doi: 10.3724/SP.J.1146.2005.01128
引用本文: 王作英, 孙健. 一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用[J]. 电子与信息学报, 2007, 29(4): 867-869. doi: 10.3724/SP.J.1146.2005.01128
Wang Zuo-ying, Sun Jian. The Inhomogeneous HMM with General Topological Structure and Its Application in Language Identification between Mandarin and English[J]. Journal of Electronics & Information Technology, 2007, 29(4): 867-869. doi: 10.3724/SP.J.1146.2005.01128
Citation: Wang Zuo-ying, Sun Jian. The Inhomogeneous HMM with General Topological Structure and Its Application in Language Identification between Mandarin and English[J]. Journal of Electronics & Information Technology, 2007, 29(4): 867-869. doi: 10.3724/SP.J.1146.2005.01128

一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用

doi: 10.3724/SP.J.1146.2005.01128

The Inhomogeneous HMM with General Topological Structure and Its Application in Language Identification between Mandarin and English

  • 摘要: 为了充分利用语音信号中的段长信息,该文提出了一种具有一般拓扑结构的非齐次隐含Markov模型(Hidden Markov Model, HMM),并将其应用于中、英文语种辨识(Language IDentification, LID)系统。非齐次HMM既很好地描述了语音信号的发生过程,又准确地利用了状态的段长信息和语言中的上下文连接结构信息,对于中、英文语种辨识系统,非齐次的HMM系统辨识性能好于齐次的HMM模型。而在非齐次的HMM中,同段长为均匀分布相比,段长分布为正态分布时系统的辨识性能更好,表明段长确实是一种重要的语种区分信息之一,且正态分布较均匀分布更接近于真实的段长分布。
  • [1] Zissman M A and Berkling K M. Automatic language identification[J].Speech Communication.2001, 35(1-2):115- [2] Zissman M A. Automatic language identification using Gauss mixture and hidden Markov models, In: 1993 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP-93, Minneapolis, Minnesota, USA, 1993, 2: 399-402. [3] House A S and Neuburg E P. Toward automatic identification of the language of an utterance. I. Preliminary methodological considerations. J. Acoust. Soc. Amer, 1977, 62(3): 708-713. [4] 王作英,肖熙. 基于段长分布的HMM语音识别模型. 电子学报, 2004, 32(1): 46-50. Wang Zuo-ying and Xiao Xi. Duration distribution based HMM speech recognition models. Acta Electronica Sinica, 2004, 32(1): 46-50. [5] Wang Z Y and Gao H G. An inhomogeneous HMM speech recognition algorithm. Chinese Journal of Electronics, 1998, 7(1): 73-77.
  • 加载中
计量
  • 文章访问数:  3161
  • HTML全文浏览量:  90
  • PDF下载量:  1146
  • 被引次数: 0
出版历程
  • 收稿日期:  2005-09-09
  • 修回日期:  2006-01-06
  • 刊出日期:  2007-04-19

目录

    /

    返回文章
    返回