位置:成果数据库 > 期刊 > 期刊详情页
面向口语统计语言模型建模的自动语料生成算法
  • ISSN号:0254-4156
  • 期刊名称:《自动化学报》
  • 时间:0
  • 分类:TN912.3[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]北京理工大学信息与电子学院,北京100081, [2]江西理工大学信息工程学院,江西赣州341000, [3]中国科学院声学研究所语言声学与内容理解重点实验室,北京100190
  • 相关基金:国家重点基础研究发展计划项目资助(2013CB32930); 国家自然科学基金资助项目(61271426,10925419,90920302,61072124,11074275,11161140319,91120001); 中国科学院战略性先导科技专项基金资助项目(XDA06030100,XDA06030500); 国家“八六三”计划项目(2012AA012503); 中科院重点部署资助项目(KGZD-EW-103-2); 江西理工大学科研基金资助项目(NSFJ2015-G21)
中文摘要:

在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语音的频谱包络在时间维度上分割成具有特征同一性的时间块,以分割块为单位计算能量特征,并进行语音/非语音决策,从而达到提高语音端点检测的稳定性目的.实验表明,提出的方法有效提高了语音端点检测的鲁棒性.

英文摘要:

The acoustic feature is not robust enough due to the interference of environmental noises.Some heuristic approaches of smoothing noisy spectra were introduced to treat with this problem.But those methods did not consider the intrinsic correlation in the time domain.This paper presents a novel method of endpoint detection,where the time sequence of logarithmic power was partitioned into homogeneous blocks using dynamic auto-segmentation.The acoustic feature was extracted from each homogenous block.The endpoint detection was conducted based on the unit of homogenous block.The experimental results showed the superiority of the proposed method.

同期刊论文项目
期刊论文 81 会议论文 59
期刊论文 111 会议论文 69 获奖 6
期刊论文 32 会议论文 7
同项目期刊论文
期刊信息
  • 《自动化学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国自动化学会 中国科学院自动化研究所
  • 主编:王飞跃
  • 地址:北京东黄城根北街16号
  • 邮编:100717
  • 邮箱:aas@ia.ac.cn
  • 电话:010-64019820
  • 国际标准刊号:ISSN:0254-4156
  • 国内统一刊号:ISSN:11-2109/TP
  • 邮发代号:2-180
  • 获奖情况:
  • 1997年获全国优秀期刊奖,1985、1990、1996、2000年获中国科学院优秀期刊二等奖,2002年获国家期刊奖
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:27550