东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于Seneff听觉谱特征的汉语连续语音声韵母边界检测

ISSN号：0371-0025
期刊名称：《声学学报》
时间：0
分类：TN912.34[电子电信—通信与信息系统;电子电信—信息与通信工程]
作者机构：[1]解放军信息工程大学信息工程学院,郑州450002
相关基金：国家高技术研究发展（863）计划项目（2006AA01Z146）

关键词：汉语连续语音, 听觉感知模型, 边界检测, 谱特征, 韵母, 结构特性, 能量分布, 频带能量, Acoustics

中文摘要：

提出了一种基于声韵母能量分布和共振峰结构特性的汉语连续语音声韵母边界检测方法。该方法首先将语音经过Seneft听觉感知模型得到听觉谱，然后基于听觉谱，选取全频带能量、低频带能量、谱重心、高低频能量比、中高频能量等特征参数对各声韵母类别能量分布和共振峰结构特性进行描述，最后根据特征参数变化剧烈的点确定出声韵母边界，并采用包络的一阶差分和基于样点的Kullback—Leibler距离对得到的边界进行修正。实验结果表明，对8kHz采样的语音边界检测准确率可达到93．7％；信噪比10dB的语音边界检测准确率可达到85．3％以上；经过参数编码后语音边界检测准确率可达86．7％以上。

英文摘要：

A boundary detection method of Chinese initials and finals is proposed based on the energy distribute and formant structure characteristics. According to this method, the auditory spectrum is first of all got after speech signal passes the Seneff＇s auditory model, and then based on the spectrum the parameters of all-band energy, low-band energy, spectrum center of gravity, ratio of high and low frequency energy, middle and high energy, etc are chose to describe the energy distribute and formant structure characteristic of different kinds of Chinese initials and finals. Finally, tile boundary is determined according to the parameter mutation, and modified using the first envelope difference and simplebased Kullback-Leibler distance. The experimental results show that under 8 kHz sampling frequency, the accuracy is 93.7% for clean speech, above 85.3% for noisy speech with the SNR of 10 dB and above 86.7% for codec speech.

同期刊论文项目

　海量语音识别综合处理系统

期刊论文 11

同项目期刊论文

汉语音节混淆网络的生成与重打分算法研究

基于语音质量参数的语音传输信道检测算法

基于统计匹配的VoIP说话人特征补偿算法

一种有效的音频分割算法

G.729编码流说话人识别研究

基于编码比特流的说话人识别

基于遗传K-均值算法的LSF参数码书设计

基于HMM的英语文语转换系统

基于非监督学习神经网络的自动调制识别研究与实现

基于能量分布和共振峰结构的汉语鼻音检测

期刊信息

《声学学报》
中国科技核心期刊

主管单位:中国科学院
主办单位:中国科学院声学研究所
主编：王小民
地址：北京北四环西路21号
邮编：100190
邮箱：
电话：010-62558329

国际标准刊号：ISSN：0371-0025
国内统一刊号：ISSN：11-2065/O4
邮发代号:2-181

获奖情况:
中国期刊方阵“双效”期刊

国内外数据库收录:
荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,美国应用力学评论,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:8376