位置:成果数据库 > 期刊 > 期刊详情页
基于声学统计建模的新一代语音合成技术
  • ISSN号:0253-2778
  • 期刊名称:《中国科学技术大学学报》
  • 时间:0
  • 分类:TN912.33[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]中国科学技术大学讯飞语音实验室,安徽合肥230026
  • 相关基金:国家自然科学基金(69975018,60475015)资助.
中文摘要:

介绍基于声学统计建模的新一代语音合成技术.重点介绍中国科学技术大学讯飞语音实验室在发展新一代语音合成技术中的贡献,包括:融合发音器官参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,从根本上改善HMM参数语音合成器在合成语音音质上的不足.这些技术创新使得新一代语音合成在自然度、表现力、灵活性及多语种实现等方面的性能都有进一步的提升.

英文摘要:

This paper introduces acoustic statistical modeling based new generation speech synthesis technology. Emphasis is laid on the research progress in the field of new generation speech synthesis technology contributed by USTC iFlytek speech laboratory, which includes integration articulatory and acoustic features for improving the flexibility of acoustic parameter generation; a minimum generation error (MGE) criterion proposed to replace maximum likelihood for improving synthesized speech quality; use of unit selection and waveform concatenation to replace parametric synthesizer, thus effectively avoiding the limitation of speech quality in HMM based parametric synthesis. These technical innovations may further improve the performance of new generation speech synthesis technology in naturalness, expressiveness, flexibility and multilingual realization, etc.

同期刊论文项目
期刊论文 13 会议论文 6 著作 1
同项目期刊论文
期刊信息
  • 《中国科学技术大学学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学技术大学
  • 主编:何多慧
  • 地址:安徽省合肥市金寨路96号
  • 邮编:230026
  • 邮箱:JUST@USTC.EDU.CN
  • 电话:0551-63601961 63607694
  • 国际标准刊号:ISSN:0253-2778
  • 国内统一刊号:ISSN:34-1054/N
  • 邮发代号:26-31
  • 获奖情况:
  • 1999年,全国优秀高等学校自然科学学报及教育部优...,2001年,安徽省1999-2001年度优秀科技期刊一等奖,2002年,第三届华东地区优秀期刊奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:8237