位置:成果数据库 > 期刊 > 期刊详情页
基于噪声分类和字典选择的语音活动检测
  • ISSN号:1671-4512
  • 期刊名称:《华中科技大学学报:自然科学版》
  • 分类:TP394[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨理工大学计算机科学与技术学院,黑龙江哈尔滨150080, [2]哈尔滨理工大学自动化学院,黑龙江哈尔滨150080
  • 相关基金:国家自然科学基金青年基金资助项目(61305001).
中文摘要:

为了解决已有语音活动检测方法在噪声条件下性能急剧下降的问题,提出了一种基于稀疏编码的语音活动检测方法.该方法在训练阶段为语音和每种可能的噪声训练字典;在识别阶段首先识别环境噪声类型,然后将语音字典和对应环境噪声字典拼接形成一个大字典用于稀疏分解,最后用语音字典上的稀疏表示实现语音和非语音的判断.该方法一方面引入了噪声类型识别,可以有针对性地选择噪声字典;另一方面引入噪声开集识别机制,能识别新的噪声类型并且为之训练模型.实验结果表明所提方法比传统方法具有更强的噪声鲁棒性.

英文摘要:

The performance of current voice activity detection (VAD) methods drops substantially in noise condition .To solve this problem ,a new VAD method based on sparse coding was proposed .In the training ,this method learns a dictionary for speech signals and each possible noise ;in the testing , this method first identifies environmental noise types ,and then concatenates the speech dictionary and corresponding environmental noise dictionary to be a large dictionary for sparse decomposition ,and fi-nally uses the representation over speech dictionary to make speech and non-speech classification . Since making using of noise classification ,this method can select noise dictionaries .In addition ,this method makes use of out-set recognition of noises ,which can recognize new noisy and train models for them .Experiments results show that the proposed method is more robust than traditional methods .

同期刊论文项目
同项目期刊论文
期刊信息
  • 《华中科技大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:中华人民共和国教育部
  • 主办单位:华中科技大学
  • 主编:丁烈云
  • 地址:武汉珞喻路1037号
  • 邮编:430074
  • 邮箱:hgxbs@mail.hust.edu.cn
  • 电话:027-87543916 87544294
  • 国际标准刊号:ISSN:1671-4512
  • 国内统一刊号:ISSN:42-1658/N
  • 邮发代号:38-9
  • 获奖情况:
  • 全国优秀科技期刊,首届国家期刊奖,第二届全国优秀科技期刊评比一等奖,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:21013