位置:成果数据库 > 期刊 > 期刊详情页
一种基于双重学习模型的可视语音合成系统
  • ISSN号:0254-0037
  • 期刊名称:北京工业大学学报
  • 时间:0
  • 页码:88-105
  • 语言:中文
  • 分类:TU391.4[建筑科学—结构工程]
  • 作者机构:[1]北京工业大学,计算机学院,多媒体与智能软件技术北京市重点实验室,北京,100124 北京工业大学,计算机学院,多媒体与智能软件技术北京市重点实验室,北京,100124 北京工业大学,计算机学院,多媒体与智能软件技术北京市重点实验室,北京,100124 北京工业大学,计算机学院,多媒体与智能软件技术北京市重点实验室,北京,100124
  • 相关基金:国家自然科学基金资助项目(60533030);北京市自然科学基金资助项目(4061001);北京市属市管高等学校人才强教计划资助项目;国家科技支撑计划资助项目(2007BA13B01).
  • 相关项目:普适计算研究-手语无障碍信息服务的普适计算
中文摘要:

为了在可视语音合成中获得更具有真实感的口型动画,提出了一种基于双重学习模型的合成方法.通过隐马尔可夫模型和遗传算法相结合的方法,可以更好地学习出语音特征与可视特征间的映射关系.该模型能去除传统语音识别领域在对大样本语音空间提取语音特征时的冗余信息,达到更好的可视语音预测效果.另外,在口型特征的表示上提出了一种基于面部动画参数特征点的几何特征表示,不仅对在不一致的光照条件下获得的训练样本有较好的鲁棒性,能更好地表征口型本身变化,而且与传统的主成分分析特征相比,具有较小的向量维数,提高了训练和合成速度.

同期刊论文项目
期刊论文 82 会议论文 40 获奖 7 专利 28
同项目期刊论文
期刊信息
  • 《北京工业大学学报》
  • 中国科技核心期刊
  • 主管单位:北京市教委
  • 主办单位:北京工业大学
  • 主编:卢振洋
  • 地址:北京市朝阳区平乐园100号
  • 邮编:100124
  • 邮箱:xuebao@bjut.edu.cn
  • 电话:010-67392535
  • 国际标准刊号:ISSN:0254-0037
  • 国内统一刊号:ISSN:11-2286/T
  • 邮发代号:2-86
  • 获奖情况:
  • 中国高等学校自然科学学报优秀学报二等奖,北京市优秀期刊,华北5省市优秀期刊,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:11924