东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于格的汉语自然对话语音索引方法研究

ISSN号：0254-4156
期刊名称：自动化学报
时间：0
页码：215-220
语言：中文
分类：TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术] TN391.4[电子电信—物理电子学]
作者机构：[1]清华大学电子工程系清华信息科学与技术国家实验室(筹),北京100084, [2]微软亚洲研究院,北京100190
相关基金：国家高技来研究发展计划（863计划）（2006AA010101,2007AA04Z223）,国家自然科学基金委员会与微软亚洲研究院联合资助项目（60776800）资助
相关项目：基于内容的跨语言语音检索方法研究

关键词：语音检索, 语音索引, 后验概率格, 索引单元, Speech retrieval speech indexing posterior lattice indexing units

中文摘要：

对汉语自然对话语音索引问题进行了研究. 比较了不同单元格的识别和检索性能, 提出不同单元格的转换方法、格间的融合方法以及格内节点与边的合并方法. 格转换实现了识别单元和索引单元的分离, 词格转换得到的无调音节格将品质因数（Figure of merit, FOM）从基线系统的69.2%提高到73.7%; 格间融合综合利用多个格的信息, 将FOM进一步提高到78.6%; 格内合并对格进行了有效的压缩, 使其可应用于海量语音检索.

英文摘要：

We examine the task of spoken term detection in Chinese spontaneous speech with a lattice-based approach. We compare lattices generated with different units and lattices converted from one unit to another. We find that the best system is with toneless-syllable lattices converted from word lattices whose figure of merit （FOM） is 73.7% from the baseline 69.2%. By combining lattices from multiple systems into a single lattice and fully exploiting the redundant information in the combined lattice with a time-based node/arc merging, we achieve the result of a compact lattice index with the accuracy improved up to 79.2%.

同期刊论文项目

基于内容的跨语言语音检索方法研究

期刊论文 39 会议论文 21 专利 1

同项目期刊论文

Vector angle minimum criteria for classifier selection in speaker verification technology

母语与非母语语音识别声学建模

基于一阶差分传声器阵列频域LMS语音增强算法

基于ARM9的英语发音质量评价系统

MLLR特征的SVM语种识别算法

Research on Intersession Variability Compensation for MLLR-SVM Speaker Recognition

汉语语音检索的集外词问题与两阶段检索方法

基于RFC模型的基频曲线导数域编码方法研究

语言学习机中使用韵律改进的发音质量评价方法研究

基于最大似然线性回归矩阵的说话人识别算法研究

Integration of Complementary Phone Recognizers for Phonotactic Language Recognition

基于听感知特征的英语句子重音检测

说话人确认技术中的一种分类器选择方法

基于小波变换和线性预测的基音提取

子带仿射投影及子带双端检测算法的回声消除系统

声源定位中的时延估计方法研究

Discriminative score fusion for language identification

Robust speaker recognition in cross-channel condition based on Gaussian mixture model

Time-frequency cepstral features and combining discriminative training for phonotactic language reco

Time-frequency cepstral features and heteroscedastic linear discriminant analysis for language recog

基于后验概率词格的汉语自然对话语音索引

基于模型融合的母语与非母语语音识别

段长在汉语语音识别系统后处理阶段的应用

中英文混合孤立词识别系统声学建模方法研究

一种面向保密通信的改进型MBE语音编码算法

一种新的声纹确认的片上系统

基于区分性向量空间模型的语种识别

Efficient Embedded Speech Recognition for Very Large Vocabulary Mandarin Car-Navigation Systems

新型多模态人性化语音交互系统

基于交叉熵顺序统计滤波的语音端点检测算法

联合因子分析中的本征信道空间拼接方法

三洋摄像机调焦聚焦噪声抑制技术研究

基于多路线性预测技术的时延估计

数字摄像机自动聚焦机械噪声消除方法研究

一种联合语种识别的新型大词汇量连续语音识别算法

期刊信息

《自动化学报》
中国科技核心期刊

主管单位:中国科学院
主办单位:中国自动化学会中国科学院自动化研究所
主编：王飞跃
地址：北京东黄城根北街16号
邮编：100717
邮箱：aas@ia.ac.cn
电话：010-64019820

国际标准刊号：ISSN：0254-4156
国内统一刊号：ISSN：11-2109/TP
邮发代号:2-180

获奖情况:
1997年获全国优秀期刊奖,1985、1990、1996、2000年获中国科学院优秀期刊二等奖,2002年获国家期刊奖

国内外数据库收录:
美国数学评论（网络版）,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:27550