位置:成果数据库 > 期刊 > 期刊详情页
基于音素混淆模型的集外词查询项扩展方法
  • ISSN号:1671-0673
  • 期刊名称:信息工程大学学报
  • 时间:2014.8.15
  • 页码:459-465
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]信息工程大学,河南郑州450001
  • 相关基金:国家自然科学基金资助项目(61175017)
  • 相关项目:基于分段条件随机场的连续语音识别技术
中文摘要:

为了提高语音查询项检索系统中集外词检索的性能,在加权有限状态转换器(weightedfinite-state transducer,WFST)框架下提出了一种基于音素混淆模型的集外词查询项扩展技术,将查询项扩展成多发音序列来解决集外词问题.首先由G2P(grapheme-to-phoneme)模型生成查询项的发音序列,然后利用音素混淆模型将发音序列扩展成N-best发音,以补偿识别错误造成Lattice建立的索引与查询项发音序列之间音素表示差异带来的影响,从而有效降低漏警率.实验结果表明,加入音素混淆模型之后,系统集外词检索性能有明显提升.

英文摘要:

To improve the performance of spoken term detection systems, a query expansion method for out-of-vocabulary (OOV) based on phonetic confusion model is presented in the weighted finite- state transducer framework (WFST). The problem of OOV is solved by expanding the queries to multiple pronunciation sequences. First, a pronunciation sequence is generated by grapheme-to-pho- neme model; then, the pronunciation sequence is expanded to N-best sequences by phonetic confusion model to compensate for potential differences caused by recognition errors in deriving index and query representations, thus reducing the missing alarm rate effectively. The experimental results show that the OOV retrieval performance of the system is improved significantly by the expansion based on phonetic confusion model.

同期刊论文项目
期刊论文 85 会议论文 9 获奖 2 著作 1
同项目期刊论文
期刊信息
  • 《信息工程大学学报》
  • 主管单位:信息工程大学
  • 主办单位:信息工程大学科研部
  • 主编:郭云飞
  • 地址:郑州市科学大道62号信息工程大学科研部
  • 邮编:450001
  • 邮箱:xxgcxb@163.com
  • 电话:0371-81630446
  • 国际标准刊号:ISSN:1671-0673
  • 国内统一刊号:ISSN:41-1196/N
  • 邮发代号:
  • 获奖情况:
  • 河南省优秀学报,河南省优秀期刊,总参优秀期刊,优秀国防期刊,《CAJ-CD规范》执行优秀奖,入选中科院核心期刊,全军首批军事学核心期刊
  • 国内外数据库收录:
  • 英国科学文摘数据库
  • 被引量:2608