东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

汉语语言集外词检索算法的改进研究

ISSN号：2095-347X
期刊名称：《网络新媒体技术》
时间：0
分类：TP311.134[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]中国科学院声学研究所语言声学与内容理解重点实验室,北京100190
相关基金：国家自然科学基金（批准号：11161140319,91120001,61271426）;中国科学院战略性先导科技专项（面向感知中国的新一代信息技术研究,编号：XDA06030100,XDA06030500）;国家863计划（资助号：2012AA012503）;中科院重点部署项目（编号：KGZD-EW-103-2）经费资助

作者：王旭阳[1], 张鹏远[1], 潘接林[1], 颜永红[1]

关键词：检索, 集外词, 令牌传递, 置信度重估, spoken term detection, OOV, token passing, keyword verification

中文摘要：

针对汉语语音关键词检索任务中的集外词检索提出了一种基于局部声学信息的改进算法。在汉语语音识别和语音关键词检索任务中,由于集外词可以由词典内部的字词组合而成,因而通常认为不存在类似英文等语言中的集外词检索的问题。然而,由于数据稀疏问题,集外词在语言模型上建模不够充分,导致解码过程中难以存留下包含集外词的路径。本文根据深度神经网络在声学模型上建模的准确性,提出了在解码过程中利用令牌保存的局部声学信息以保留那些局部声学概率高而即将被剪枝掉的令牌,从而在词图中保留下来包含集外词的路径,提高集外词检索的召回率；然后再利用关键词置信度重估技术提高集外词检索的精度。实验表明,利用解码过程中的局部声学信息可以提高集外词检索的性能,召回率相对于基线系统有10%的绝对提高；在高精度区,使用置信度重估后本文提出的方法同样取得显著提高。

英文摘要：

Out of vocabulary （OOV） word detection is an important issue in spoken term detection （STD）. Unlike the detection of OOV words in English, Mandarin OOV words can be composed of in - vocabulary words and are considered less influential. However, due to data scarcity, the language model probabilities for OOV words is relative low and the paths containing OOV words at the deco- ding stage cannot be preserved. In this paper, the use of integration with local acoustic information is investigated to retrieve more OOV words. Tokens with high acoustic probabilities in the search space will be forced to propagate to the next frame. In this way, acoustic similar words can be reserved in the recognition results. Experimental results show that this new approach results in 10% absolute to the baseline system and the improvement is also significant in the high precision area.

同期刊论文项目

行车环境听觉模型及声音处理关键技术研究

期刊论文 38 会议论文 44

语音缺失频谱重建及语音频谱二维相关性建模的研究

期刊论文 28

面向下一代互联网的超临场感声通信应用研究

期刊论文 50 会议论文 53

同项目期刊论文

A Comparative Study on Selecting Acoustic Modeling Units in Deep Neural Networks based Large Vocabul

A computational model for assessment of speech intelligibility in informational masking

Multi-level Linguistic Knowledge Based Chinese Grapheme-to-Phoneme Conversion

面向大语料库的语音合成方法研究

融合测程法与视觉信息的足球机器人自定位方法

近场结构化头相关传输函数的测量与分析

成年口吃者流畅朗读中塞音的声学分析

基于隐藏单元条件随机场的多知识源融合改进自动语音识别置信度

多领域系统融合在语音云系统中的应用

利用二重打分方法的激活词语音识别

鉴别性最大后验概率线性回归说话人自适应研究

语音中元音和辅音的听觉感知研究

鉴别性最大后验概率声学模型自适应

中文口语理解弱监督训练方法

语音识别中深度神经网络目标值优化

基于卷积神经网络的连续语音识别

面向语音增强的约束序贯高斯混合模型噪声功率谱估计

HMM-based noise estimator for speech enhancement

Acoustic characteristics of stop consonants in fluent reading Chinese Putonghua speech of adult stutterers

A forced alignment approach to detect Chinese repetitive stuttering

汉语连续语音识别系统中三音子模型的优化

ANC次级通道在线建模的辅助噪声控制方法

基于加权有限状态机的动态匹配词图生成算法

基于PLDA的多信道多语音说话人确认研究

高斯PLDA在说话人确认中的应用及其联合估计

基于非负矩阵分解的钢琴多音符估计

卷积神经网络在语音识别中的应用

面向口语统计语言模型建模的自动语料生成算法

基于张量分解模型的语音信号特征提取方法

嵌入式中文语音合成系统非周期成分音节层建模方法

A novel cache size optimization scheme based on manifold learningin Content Centric Networking

一种结合G.719编解码器的参数立体声音频编解码扩展方法

A Novel Multichannel Audio Signal Compressing Method Based on Tensor Representation and Decompositio

Mapping methods for output-based objective speech quality assessment using data mining

Context-based adaptive arithmetic coding in time and frequency domain for the lossless compression o

Objective and Subjective Investigation on a Novel Method for Digital Reverberator Parameters Estimat

A sound image externalization approach for headphone reproduction by simulating binaural room impuls

A Policy-Based Web Service Redundancy Detection in Wireless Sensor Networks

Perceptual MVDR-based cepstral coefficients (PMCCs) for speaker recognition

成年口吃者流畅朗读中塞音的声学分析

多特征融合的英语口语考试自动评分系统的研究

可重构网络中基于中心度与拓扑势排序的资源分配算法

波场合成与波场分析的有源房间补偿方法

A Novel Cache Size Optimization Scheme Based on Manifold Learning in Content Centric

基于隐藏单元条件随机场的多知识源融合改进自动语音识别置信度

多领域系统融合在语音云系统中的应用

利用二重打分方法的激活词语音识别

鉴别性最大后验概率线性回归说话人自适应研究

语音中元音和辅音的听觉感知研究

鉴别性最大后验概率声学模型自适应

中文口语理解弱监督训练方法

语音识别中深度神经网络目标值优化

基于卷积神经网络的连续语音识别

语言声学与内容理解研究进展

Towards Qo E-based resource allocation schemes in SC-FDMA systems

基于频域逐级回归的声学回声控制

基于词矢量相似度的短文本分类

行驶汽车环境中的话音活动检测研究

Speex编码器中回声消除算法的分析与评估

面向语音增强的约束序贯高斯混合模型噪声功率谱估计

HMM-based noise estimator for speech enhancement

Acoustic characteristics of stop consonants in fluent reading Chinese Putonghua speech of adult stutterers

A forced alignment approach to detect Chinese repetitive stuttering

汉语连续语音识别系统中三音子模型的优化

ANC次级通道在线建模的辅助噪声控制方法

基于加权有限状态机的动态匹配词图生成算法

基于PLDA的多信道多语音说话人确认研究

高斯PLDA在说话人确认中的应用及其联合估计

基于非负矩阵分解的钢琴多音符估计

卷积神经网络在语音识别中的应用

面向口语统计语言模型建模的自动语料生成算法

基于隐藏单元条件随机场的多知识源融合改进自动语音识别置信度

多领域系统融合在语音云系统中的应用

利用二重打分方法的激活词语音识别

鉴别性最大后验概率线性回归说话人自适应研究

语音中元音和辅音的听觉感知研究

中文口语理解弱监督训练方法

语音识别中深度神经网络目标值优化

基于卷积神经网络的连续语音识别

基于词矢量相似度的短文本分类

面向语音增强的约束序贯高斯混合模型噪声功率谱估计

口语对话状态追踪的研究

基于艺人画像的歌曲点播量预测

传声器阵列波束比判决语音增强方法

HMM-based noise estimator for speech enhancement

基于CNN-SVM和转发树的微博事件情感分析

Acoustic characteristics of stop consonants in fluent reading Chinese Putonghua speech of adult stutterers

A forced alignment approach to detect Chinese repetitive stuttering

汉语连续语音识别系统中三音子模型的优化

ANC次级通道在线建模的辅助噪声控制方法

基于加权有限状态机的动态匹配词图生成算法

基于PLDA的多信道多语音说话人确认研究

高斯PLDA在说话人确认中的应用及其联合估计

基于非负矩阵分解的钢琴多音符估计

卷积神经网络在语音识别中的应用

面向口语统计语言模型建模的自动语料生成算法

基于概率语义分布的短文本分类

期刊信息

《网络新媒体技术》
中国科技核心期刊

主管单位:中国科学院
主办单位:中国科学院声学研究所
主编：倪宏
地址：北京海淀区北四环西路21号
邮编：100190
邮箱：xmt@dsp.ac.cn
电话：010-82547906

国际标准刊号：ISSN：2095-347X
国内统一刊号：ISSN：10-1055/TP
邮发代号:2-304

获奖情况:
1990年获海洋出版社优秀期刊奖

国内外数据库收录:
中国中国科技核心期刊

被引量:200