位置:成果数据库 > 期刊 > 期刊详情页
基于后验概率特征的改进无监督语音样例检测
  • ISSN号:1671-0673
  • 期刊名称:信息工程大学学报
  • 时间:2015.8
  • 页码:449-453
  • 分类:TP391.42[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]信息工程大学,河南郑州450001, [2]海军指挥学院,江苏南京210016
  • 相关基金:国家自然科学基金资助项目(61175017)
  • 相关项目:基于分段条件随机场的连续语音识别技术
中文摘要:

针对现有无监督语音样例检测精度不高的现状,提出一种基于后验概率特征和主成分分析的方法。该方法首先利用无标注语料训练GMM,得到训练数据频谱参数的高斯混元后验概率特征向量序列;采用层次聚类算法检测其边界信息得到声学分段,利用K-means算法对所有声学分段聚类并添加标签,通过声学分段和标签训练基于后验概率的声学分段模型(ASMs);ASMs将查询项-9检索文档的高斯混元后验概率转换为新的后验概率,利用主成分分析方法对其优化处理,保持概率向量维数不变,去除噪声信息,提高后验概率特征向量鲁棒性与区分性:最后通过分段动态时间规整算法检索查询项。实验证明该方法的检索精度较现有方法有显著提升。

英文摘要:

This paper presents a study of using posterior features and principal components analysis to improve the detection of unsupervised query-by-example spoken terms. A Gaussian Mixture Model is trained without any transcription information to label speech frames with Gaussian posteriorgram. Through hierarchical agglomerative clustering and K-means, the boundaries and labels are obtained to train acoustic segment models (ASMs). Additionally by principal components analysis, ASMs posteriorgrams are extracted and then the segmental dynamic time warping is applied to match the query, to test posteriorgrams, and to locate possible occurrences of the query term. Experimental re- suits show that the proposed method consistently outperform the traditional method.

同期刊论文项目
期刊论文 85 会议论文 9 获奖 2 著作 1
同项目期刊论文
期刊信息
  • 《信息工程大学学报》
  • 主管单位:信息工程大学
  • 主办单位:信息工程大学科研部
  • 主编:郭云飞
  • 地址:郑州市科学大道62号信息工程大学科研部
  • 邮编:450001
  • 邮箱:xxgcxb@163.com
  • 电话:0371-81630446
  • 国际标准刊号:ISSN:1671-0673
  • 国内统一刊号:ISSN:41-1196/N
  • 邮发代号:
  • 获奖情况:
  • 河南省优秀学报,河南省优秀期刊,总参优秀期刊,优秀国防期刊,《CAJ-CD规范》执行优秀奖,入选中科院核心期刊,全军首批军事学核心期刊
  • 国内外数据库收录:
  • 英国科学文摘数据库
  • 被引量:2608