位置:成果数据库 > 期刊 > 期刊详情页
基于互补子词单元词图融合的集外词识别
  • ISSN号:1003-6059
  • 期刊名称:《模式识别与人工智能》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:中国人民解放军信息工程大学信息系统工程学院,郑州450002
  • 相关基金:国家自然科学基金项目(No.61403415,61302107,61175017)资助
中文摘要:

混合模型在进行集外词识别时,采用不同类型的子词单元通常具有性能上的互补性.基于此种情况,文中提出互补子词单元词图融合的集外词识别方法.首先分别采用音节和字母音素对搭建2套具有性能差异性的混合模型系统.然后获得这2套系统的识别词图,并合并处理词图中的子词单元.最后分别采用基于词图并集和基于词图交集的融合策略融合处理后的词图,得到更好的集外词识别结果.实验表明文中方法性能优于单系统及ROVER方法.

英文摘要:

Different sub-lexical units used in hybrid model often provide complementary information for each other during out-of-vocabulary (OOV) words recognition. In this paper, a lattice combination method of complement sub-lexical units for out-of-vocabulary words recognition is proposed. Firstly, two hybrid model systems with performance difference are built respectively by using syllables and graphones. Next, the recognition lattices are obtained from the built systems and the sub-lexical units are preprocessed for the purpose of combination. Finally, the combination strategies based on lattices union and lattices intersection are respectively explored to combine the lattices to acquire the better result of OOV Words recognition . The experimental results show the proposed method is superior to individual system and the recognizer output voting error reduction (ROVER) system in OOV words recognition.

同期刊论文项目
期刊论文 85 会议论文 9 获奖 2 著作 1
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169