本课题主要针对汉语和英语进行基于内容的跨语言语音检索技术的创新性研究,涉及特征参数、建模方法、识别和搜索算法等关键科学问题,着重提高实际环境下语音检索系统的性能、效率和稳健性。在研究中,针对语音检索系统,提出了一种基于最大化代价函数的工作点置信度判决门限估值方法;提出了两种基于子词匹配的容错检索系统的构建方法;针对集外查询词提出基于模糊匹配的容错检索方法和对原始词图拓扑结构和似然分数两方面进行修正的方法;提出了基于后验概率词图的融合策略和融合词图的内部路径扩展方法;提出将双线性Logistic回归方法应用于多个异构语音检索子系统的分数融合中,实现了两阶段的融合方案;提出基于互联网数据的查询扩展和语言模型的在线自适应方法;提出了一种块状对角异方差分析的语种识别特征变换和一种基于多坐标系序列内核支持向量机的语种识别方法;提出了一种基于两阶段策略和一种基于仿生模式识别思想的固定音频检索算法。发表相关论文55篇,其中SCI收录7篇次,EI收录40篇次,ISTP收录22篇次;申请国家发明专利2项。培养出2名博士后、7名博士、3名硕士。
英文主题词speech retrieval; cross-language information retrieval; multilingual speech recognition; error-tolerant retrieval; system fusion