高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

韵律块基频曲线的优化及规则

刘浩杰 杜利民 付跃文

刘浩杰, 杜利民, 付跃文. 韵律块基频曲线的优化及规则[J]. 电子与信息学报, 2007, 29(1): 71-75. doi: 10.3724/SP.J.1146.2005.00452
引用本文: 刘浩杰, 杜利民, 付跃文. 韵律块基频曲线的优化及规则[J]. 电子与信息学报, 2007, 29(1): 71-75. doi: 10.3724/SP.J.1146.2005.00452
Liu Hao-jie, Du Li-min, Fu Yue-wen. F0 Contour Optimization and Its Rules in Chinese[J]. Journal of Electronics & Information Technology, 2007, 29(1): 71-75. doi: 10.3724/SP.J.1146.2005.00452
Citation: Liu Hao-jie, Du Li-min, Fu Yue-wen. F0 Contour Optimization and Its Rules in Chinese[J]. Journal of Electronics & Information Technology, 2007, 29(1): 71-75. doi: 10.3724/SP.J.1146.2005.00452

韵律块基频曲线的优化及规则

doi: 10.3724/SP.J.1146.2005.00452

F0 Contour Optimization and Its Rules in Chinese

  • 摘要: 汉语规则合成系统中,连续语流基频曲线(F0曲线)的生成并不是各个合成单元F0曲线的简单拼接,而是语音学功能单元的综合作用。该文提出了汉语韵律块基频曲线优化的正演思想,使韵律块内的基频曲线融入重音强度、形状失真度以及发音速度等语境和发音的个体信息,提高合成语音的自然度。基于这种优化思想,该文针对聚类后的单音节、二音节和三音节韵律块的基频曲线,利用最小均方误差准则通过反演提取了各个单元的优化相关参数(高音线、低音线、平滑因子、形状失真度、重音强度)。对音节在韵律块中的位置因素和声调因素对优化相关参数的影响的统计分析表明了参数提取结果的可靠性和基频曲线优化的合理性,得到了优化控制参数在规则合成系统中具体的应用规则。实际的听测实验表明,韵律块基频曲线进行优化前后,合成系统的清晰度分别为3.25和3.35,自然度分别为2.9和3.31。
  • ].Speech Communication.2001, 33(4):319- [4] Press H and Teukolsky A, et al.. Numerical recipes in c. New York: Cambridge University Press, 1992: 657-661. [5] 杨顺安. 浊声源动态特性对合成音质的影响. 中国语文,1986, (3): 173-181. [6] Coleman T F and Li Y. An interior, trust region approach for nonlinear minimization subject to bounds. STAM Journal on Optimization, 1996, (2): 418-445. [7] 李香春. 汉语单音节、两音节组和三音节组基频曲线建模方法研究. [博士论文], 中国科学院声学研究所, 2002. [8] 沈炯. 北京话声调的音域和语调. 北京语音实验录, 北京: 北京大学出版社,1985: 73-130. [9] 王安红,陈明,吕士楠. 基于言语数据库的汉语高音下倾现象研究. 声学学报,2004,29(4): 353-358. Wang Anhong, Chen Ming, and Lu Shinan. The study of declination in speech database in standard Chinese. Acta Acustica,2004,29(4):353-358. [10] 王韫佳,初敏等. 连续话语中双音节韵律词的重音感知. 声学学报,2003, 28(6): 534-539 Wang Yunjia and Chu Min, et al.. The perception of disyllabic word stress of Chinese speech in utterance. Acta Acustica,2003, 28(6): 534-539. [11] 颜景助,林茂灿. 北京话三字组重音的声学表现. 方言, 1988, (3): 227-237. .

    [1] Greg Kochansaki and Chilin Shih. Stem-ML: Language-independent prosody description. in Proceedings of the International Conference on Spoken Language Processing 2000, Beijing, China, 2000, Vol.3: 239-242. [2] Fujisaki Hiroya. The fundamental frequency contour of speech: Its modeling.[J].underlying mechanisms, and application to multilingual speech synthesis. In Proceedings of ICSP99, Seoul Korea.1999,:- [3] Xu Yi. Pitch targets and their realization: Evidence from Manda.
  • 加载中
计量
  • 文章访问数:  3244
  • HTML全文浏览量:  81
  • PDF下载量:  1239
  • 被引次数: 0
出版历程
  • 收稿日期:  2005-04-22
  • 修回日期:  2005-10-15
  • 刊出日期:  2007-01-19

目录

    /

    返回文章
    返回