位置:成果数据库 > 期刊 > 期刊详情页
基于多时间尺度韵律特征分析的语音转换研究
  • ISSN号:1673-629X
  • 期刊名称:计算机技术与发展
  • 时间:2012.12.12
  • 页码:67-70+74
  • 分类:TP31[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]南京邮电大学通信与信息工程学院,江苏南京210003
  • 相关基金:国家自然科学基金资助项目(60902065,61001152,61172118);浙江省自然科学基金(Y1090649);南京邮电大学引进人才基金(NY209004)
  • 相关项目:高分辨率无序大尺度场景的多视图三维立体重建
中文摘要:

为了提高转换语音的可懂度与自然度,文中在语音信号的特征抽取方面,注重对语音信号韵律特性的研究,提出了一种多时间尺度的韵律特性抽取方法及其参数化表示,基于逐级细化的策略实现语音信号在多时间尺度下的韵律特征分析与提取,实现对韵律特性从整体到局部细致完整地刻画,克服了韵律信息表述的模糊性和复杂性。实验结果表明,文中提出的语音转换系统在四种测试类型中性能良好,与现有的高斯混合模型相比,ABX测试结果提高了10.88%,同时MOS得分平均提高了18.59%。

英文摘要:

In order to improve the conversion speech intelligibility and natural degrees, based on speech signal feature extraction, pay great attention to the research of speech signal prosody characteristics, put forward a prosody characteristics extraction method based on multi- time scale and parameterized representation. Based on stepwise refinement strategy, achieve the implementation of prosodic feature extrac- tion on different time scales, which can enable detailed full description for prosodic information from global to local,overcome the ambi guity and complexity of prosody characterization. The experimental results show that the performance of proposed voice conversion sys tem in four test type is good,and compared with existing Gaussian mixture model,ABX test results increased by 10.88% ,and at the same time,MOS scoring average is improved by 18.59%.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机技术与发展》
  • 中国科技核心期刊
  • 主管单位:陕西省工业和信息化厅
  • 主办单位:陕西省计算机学会
  • 主编:王守智
  • 地址:西安市雁塔路南段99号
  • 邮编:710054
  • 邮箱:ctad@vip.163.com
  • 电话:029-85522163
  • 国际标准刊号:ISSN:1673-629X
  • 国内统一刊号:ISSN:61-1450/TP
  • 邮发代号:52-127
  • 获奖情况:
  • 《CAJ-CD规范》执行优秀期刊
  • 国内外数据库收录:
  • 中国中国科技核心期刊
  • 被引量:21263