高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于加权有限状态机的动态匹配词图生成算法

郭宇弘 黎塔 肖业鸣 潘接林 颜永红

郭宇弘, 黎塔, 肖业鸣, 潘接林, 颜永红. 基于加权有限状态机的动态匹配词图生成算法[J]. 电子与信息学报, 2014, 36(1): 140-146. doi: 10.3724/SP.J.1146.2013.00422
引用本文: 郭宇弘, 黎塔, 肖业鸣, 潘接林, 颜永红. 基于加权有限状态机的动态匹配词图生成算法[J]. 电子与信息学报, 2014, 36(1): 140-146. doi: 10.3724/SP.J.1146.2013.00422
Guo Yu-Hong, Li Ta, Xiao Ye-Ming, Pan Jie-Lin, Yan Yong-Hong. Exact Word Lattice Generation in Weighted Finite State Transducer Framework[J]. Journal of Electronics & Information Technology, 2014, 36(1): 140-146. doi: 10.3724/SP.J.1146.2013.00422
Citation: Guo Yu-Hong, Li Ta, Xiao Ye-Ming, Pan Jie-Lin, Yan Yong-Hong. Exact Word Lattice Generation in Weighted Finite State Transducer Framework[J]. Journal of Electronics & Information Technology, 2014, 36(1): 140-146. doi: 10.3724/SP.J.1146.2013.00422

基于加权有限状态机的动态匹配词图生成算法

doi: 10.3724/SP.J.1146.2013.00422
基金项目: 

国家自然科学基金(10925419, 90920302, 61072124, 11074275, 11161140319, 91120001, 61271426),中国科学院战略性先导科技专项(XDA06030100, XDA06030500),国家863计划项目(2012AA012503)和中科院重点部署项目(KGZD-EW-103-2)资助课题

Exact Word Lattice Generation in Weighted Finite State Transducer Framework

  • 摘要: 由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。
  • 加载中
计量
  • 文章访问数:  2776
  • HTML全文浏览量:  129
  • PDF下载量:  2744
  • 被引次数: 0
出版历程
  • 收稿日期:  2013-04-01
  • 修回日期:  2013-07-18
  • 刊出日期:  2014-01-19

目录

    /

    返回文章
    返回