位置:成果数据库 > 期刊 > 期刊详情页
基于非负矩阵分解的1kbit/s波形内插语音编码算法
  • ISSN号:1001-0505
  • 期刊名称:《东南大学学报:自然科学版》
  • 时间:0
  • 分类:TN912.3[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]东南大学信息科学与工程学院,南京210096, [2]东南大学水声信号处理教育部重点实验室(B类筹),南京210096
  • 相关基金:国家自然科学基金资助项目(60971098)
中文摘要:

为了进一步降低编码速率,提出了一种基于非负矩阵分解的1kbit/s波形内插语音编码算法.该算法对特征波表面的幅度矩阵进行非负矩阵分解,以获得局部特征矩阵,并对该局部特征矩阵进行约束和改进,使优化后局部特征更加突出.对应的基矢量进一步稀疏,从而有利于对权矢量的量化,以实现对特征波表面的高效编码.该算法同时加入清浊音标志,对特征波表面的相位谱进行估计,以更好地提高合成语音质量.实验表明,该算法能够在1kbit/s的低编码速率条件下,获得与1.2kbit/s混合激励线性预测语音编码算法相近的合成语音质量,取得了较好的效果.

英文摘要:

A 1kbit/s waveform interpolation speech coding is proposed based on non-negative matrix factorization to achieve the lower encoding bit-rate.The new coder decomposes the magnitude matrix of the characteristic waveform surface with the non-negative matrix factorization to obtain the local characteristic matrix.Then the local characteristic matrix is improved with some constraints to enhance the local characters and make the corresponding basis vectors sparser,which is propitious to the quantization of the weighted vectors and can encode the character waveform surface more effectively.The surd/sonant flag is also introduced to estimate the phase spectrum of the character waveform surface,which can improve the synthetic speech quality better.The results show that the new algorithm can make the synthetic speech quality nearly the same as the speech quality from 1.2kbit/s mixed excitation linear prediction speech coding algorithm in the case of low encoding bit-rate of 1kbit/s,and achieves a good performance.

同期刊论文项目
期刊论文 24 会议论文 8 专利 1
同项目期刊论文
期刊信息
  • 《东南大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:教育部
  • 主办单位:东南大学
  • 主编:毛善锋
  • 地址:南京四牌楼2号
  • 邮编:210096
  • 邮箱:xuebao@seu.edu.cn
  • 电话:025-83794323
  • 国际标准刊号:ISSN:1001-0505
  • 国内统一刊号:ISSN:32-1178/N
  • 邮发代号:28-15
  • 获奖情况:
  • 先后荣获第三届国家期刊奖百种重点期刊奖,2006-2...,2013年荣获首届江苏省新闻出版政府奖"报刊奖"
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23651