位置:成果数据库 > 期刊 > 期刊详情页
基于Seneff听觉谱特征的汉语连续语音声韵母边界检测
  • ISSN号:0371-0025
  • 期刊名称:《声学学报》
  • 时间:0
  • 分类:TN912.34[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]解放军信息工程大学信息工程学院,郑州450002
  • 相关基金:国家高技术研究发展(863)计划项目(2006AA01Z146)
中文摘要:

提出了一种基于声韵母能量分布和共振峰结构特性的汉语连续语音声韵母边界检测方法。该方法首先将语音经过Seneft听觉感知模型得到听觉谱,然后基于听觉谱,选取全频带能量、低频带能量、谱重心、高低频能量比、中高频能量等特征参数对各声韵母类别能量分布和共振峰结构特性进行描述,最后根据特征参数变化剧烈的点确定出声韵母边界,并采用包络的一阶差分和基于样点的Kullback—Leibler距离对得到的边界进行修正。实验结果表明,对8kHz采样的语音边界检测准确率可达到93.7%;信噪比10dB的语音边界检测准确率可达到85.3%以上;经过参数编码后语音边界检测准确率可达86.7%以上。

英文摘要:

A boundary detection method of Chinese initials and finals is proposed based on the energy distribute and formant structure characteristics. According to this method, the auditory spectrum is first of all got after speech signal passes the Seneff's auditory model, and then based on the spectrum the parameters of all-band energy, low-band energy, spectrum center of gravity, ratio of high and low frequency energy, middle and high energy, etc are chose to describe the energy distribute and formant structure characteristic of different kinds of Chinese initials and finals. Finally, tile boundary is determined according to the parameter mutation, and modified using the first envelope difference and simplebased Kullback-Leibler distance. The experimental results show that under 8 kHz sampling frequency, the accuracy is 93.7% for clean speech, above 85.3% for noisy speech with the SNR of 10 dB and above 86.7% for codec speech.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《声学学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院声学研究所
  • 主编:王小民
  • 地址:北京北四环西路21号
  • 邮编:100190
  • 邮箱:
  • 电话:010-62558329
  • 国际标准刊号:ISSN:0371-0025
  • 国内统一刊号:ISSN:11-2065/O4
  • 邮发代号:2-181
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,美国应用力学评论,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:8376