位置:成果数据库 > 期刊 > 期刊详情页
汉语语言集外词检索算法的改进研究
  • ISSN号:2095-347X
  • 期刊名称:《网络新媒体技术》
  • 时间:0
  • 分类:TP311.134[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院声学研究所语言声学与内容理解重点实验室,北京100190
  • 相关基金:国家自然科学基金(批准号:11161140319,91120001,61271426);中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究,编号:XDA06030100,XDA06030500);国家863计划(资助号:2012AA012503);中科院重点部署项目(编号:KGZD-EW-103-2)经费资助
中文摘要:

针对汉语语音关键词检索任务中的集外词检索提出了一种基于局部声学信息的改进算法。在汉语语音识别和语音关键词检索任务中,由于集外词可以由词典内部的字词组合而成,因而通常认为不存在类似英文等语言中的集外词检索的问题。然而,由于数据稀疏问题,集外词在语言模型上建模不够充分,导致解码过程中难以存留下包含集外词的路径。本文根据深度神经网络在声学模型上建模的准确性,提出了在解码过程中利用令牌保存的局部声学信息以保留那些局部声学概率高而即将被剪枝掉的令牌,从而在词图中保留下来包含集外词的路径,提高集外词检索的召回率;然后再利用关键词置信度重估技术提高集外词检索的精度。实验表明,利用解码过程中的局部声学信息可以提高集外词检索的性能,召回率相对于基线系统有10%的绝对提高;在高精度区,使用置信度重估后本文提出的方法同样取得显著提高。

英文摘要:

Out of vocabulary (OOV) word detection is an important issue in spoken term detection (STD). Unlike the detection of OOV words in English, Mandarin OOV words can be composed of in - vocabulary words and are considered less influential. However, due to data scarcity, the language model probabilities for OOV words is relative low and the paths containing OOV words at the deco- ding stage cannot be preserved. In this paper, the use of integration with local acoustic information is investigated to retrieve more OOV words. Tokens with high acoustic probabilities in the search space will be forced to propagate to the next frame. In this way, acoustic similar words can be reserved in the recognition results. Experimental results show that this new approach results in 10% absolute to the baseline system and the improvement is also significant in the high precision area.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《网络新媒体技术》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院声学研究所
  • 主编:倪宏
  • 地址:北京海淀区北四环西路21号
  • 邮编:100190
  • 邮箱:xmt@dsp.ac.cn
  • 电话:010-82547906
  • 国际标准刊号:ISSN:2095-347X
  • 国内统一刊号:ISSN:10-1055/TP
  • 邮发代号:2-304
  • 获奖情况:
  • 1990年获海洋出版社优秀期刊奖
  • 国内外数据库收录:
  • 中国中国科技核心期刊
  • 被引量:200