位置:成果数据库 > 期刊 > 期刊详情页
基于互信息置信度的网格连续汉语语音检索
  • ISSN号:1001-3695
  • 期刊名称:计算机应用研究
  • 时间:0
  • 页码:4607-4609
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工程大学信息与通信工程学院,哈尔滨150001, [2]黑龙江工程学院电子工程系,哈尔滨150050
  • 相关基金:国家自然科学基金资助项目(60702053)
  • 相关项目:基于Lattice的汉语语音主题分类方法研究
作者: 张磊|
中文摘要:

针对目前生活中涌现的海量语音数据,人们对语音检索技术准确度的要求越来越高。主要研究了汉语连续语音检索任务中,基于转换音节网格的研究方法。针对语音检索系统中置信度计算的问题,提出了一种基于音节间互信息的置信度计算方法,并将其用于网格结构的语音检索系统中。该方法能够有效地利用上下文之间的互信息量,从而更准确、合理地描述汉语语言模型。实验结果表明,用提出的方法建立转换音节网格来进行语音检索,其检出率(FOM)比后验概率法和N-best法有较大幅度的提高。得到的汉语语音检索系统其FOM最高可以达到83.7%。

英文摘要:

Nowadays, with the overwhelming amounts of speech data rushing in our life, higher and higher accuracy of speech indexing techniques is required. This paper mainly studied a converted syllable lattice-based approach in a Chinese continuous speech indexing task. Aiming at the computation of confidence measure in a speech indexing system, this paper proposed a confidence measure method based on mutual information between syllables, which was used in a lattice construction system for speech indexing. The method took full advantage of the context mutual information, which could describe Chinese language model more exactly and logically. The experiment results show that using the proposed method to build a converted syllable lattice in a speech indexing system, the FOM of which has great improvement comparing with posterior probability based method and N-best based method. This best system for Chinese speech indexing achieves a FOM of 83.7%.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用研究》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术厅
  • 主办单位:四川省计算机研究院
  • 主编:刘营
  • 地址:成都市成科西路3号
  • 邮编:610041
  • 邮箱:arocmag@163.com
  • 电话:028-85210177 85249567
  • 国际标准刊号:ISSN:1001-3695
  • 国内统一刊号:ISSN:51-1196/TP
  • 邮发代号:62-68
  • 获奖情况:
  • 第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:60049