位置:成果数据库 > 期刊 > 期刊详情页
基于卷积非负矩阵分解的语音转换方法
  • ISSN号:1004-9037
  • 期刊名称:《数据采集与处理》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]解放军理工大学通信工程学院,南京210007, [2]解放军理工大学指挥自动化学院,南京210007
  • 相关基金:国家自然科学基金(61072042)资助项目;解放军理工大学预先研究基金(20110205,20110211)资助项目.
中文摘要:

为了在语音转换过程中充分考虑语音的帧问相关性,提出了一种基于卷积非负矩阵分解的语音转换方法。卷积非负矩阵分解得到的时频基可较好地保存语音信号中的个人特征信息及帧间相关性。利用这一特性,在训练阶段,通过卷积非负矩阵分解从训练数据中提取源说话人和目标说话人相匹配的时频基。在转换阶段,通过时频基替换实现对源说话人语音的转换。相对于传统方法,本方法能够更好地保存和转换语音帧间相关性。实验仿真及主、客观评价结果表明,与基于高斯混合模型、状态空间模型的语音转换方法相比,该方法具有更好的转换语音质量和转换相似度。

英文摘要:

In order to fully consider the inter-frame correlation in voice conversion, a voice con- version method based on convolutive nonnegative matrix factorization is proposed. The person- al characteristics and inter-frame correlation in voice can be well preserved in the time-frequen-cy bases obtained from convolutive nonnegative matrix factorization. With this feature, during the training phase of voice conversion, the matching time-frequency bases of source and target speakers can be extracted from training data through convolutive nonnegative matrix factoriza-tion. Then in the conversion phase, the voice of source speaker is converted through time-fre-quency bases substitution. Compared with traditional methods, the inter-frame correlation in voice can be better preserved and converted in the proposed method. Experimental results using objective and subjective evaluations show that the proposed method outperforms the methods based on Gaussian mixture model and the state space model in the view of both speech quality and conversion similarity to the target speech.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《数据采集与处理》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国电子学会 仪器仪表学会 信号处理学会 中国一汽仪表学会 中国物理学会 微弱信号检测学会 南京航空航天大学
  • 主编:贲德
  • 地址:南京市御道街29号
  • 邮编:210016
  • 邮箱:sjcj@nuaa.edu.cn
  • 电话:025-84892742
  • 国际标准刊号:ISSN:1004-9037
  • 国内统一刊号:ISSN:32-1367/TN
  • 邮发代号:28-235
  • 获奖情况:
  • 中国科技论文统计源用刊,2007年被评为江苏省优秀期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:8148