东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

口语对话状态追踪的研究

ISSN号：2095-347X
期刊名称：《网络新媒体技术》
时间：0
分类：TP309[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
作者机构：中国科学院声学研究所语言声学与内容理解重点实验室,北京100190
相关基金：国家自然科学基金：（编号：11461141004,61271426,11504406,11590770,11590771,11590772,11590773,11590774）; 中国科学院战略性先导科技专项（面向感知中国的新一代信息技术研究,编号：XDA06030100,XDA06030500,XDA06040603）; 国家863计划（编号：2015AA016306）; 国家973计划（编号：2013CB329302）; 新疆维吾尔自治区科技重大专项（编号：201230118-3）

作者：任航, 徐为群, 颜永红

关键词：语音对话系统, 鉴别式模型, 对话状态跟踪, spoken dialog system, discriminative modeling, dialog state tracking

中文摘要：

口语对话系统是最自然的人机交互界面之一。然而语音识别和口语理解模块带来的级联错误会对用户体验造成很大影响,在嘈杂的环境中更为严重。对话状态跟踪器可根据对话的上下文和可观测到的语音识别、理解结果对各个回合的对话状态做出估计。因此,提出一种由数据驱动基于鉴别式模型的对话状态追踪方法,能够处理更大规模的特征集,特征函数依赖于可观测的全部N-best结果。通过在真实语音数据集上进行评测,实验结果表明,该方法比单纯使用1-best结果的基线系统具有更强的性能。

英文摘要：

Spoken dialog system is a natural and intuitive human- computer interface. But the errors resulted from automatic speech recognition and spoken lanuage understanding will harm user experience,which is more serious in noisy environment. Dialog state trackers make estimation of the current dialog states by observations in dialog history. In this paper we propose a data- driven dialog state tracking method by discriminative modeling. This method can handle large feature sets which can utilize full observed N- best results. The proposed method show better performance than baseline operating on 1-best results.

同期刊论文项目

多语言言语识别基础理论与建模方法

期刊论文 6

面向下一代互联网的超临场感声通信应用研究

期刊论文 7

言语生成和感知相互关系研究及在抗噪中的应用

期刊论文 4

多语言言语数据的获取、标注和分析研究

期刊论文 4

韵律模型的构建及在言语识别中的应用

期刊论文 3

基于因子分析的会话语音说话人识别研究

期刊论文 5

语音缺失频谱重建及语音频谱二维相关性建模的研究

期刊论文 28

面向多语言层次化和结构化的声学模型建模方法与系统集成

期刊论文 3

同项目期刊论文

虚拟现实中三维音频关键技术现状及发展

基于艺人画像的歌曲点播量预测

应用于语种识别的加权音素对数似然比特征

传声器阵列波束比判决语音增强方法

基于CNN-SVM和转发树的微博事件情感分析

基于概率语义分布的短文本分类

基于艺人画像的歌曲点播量预测

传声器阵列波束比判决语音增强方法

基于CNN-SVM和转发树的微博事件情感分析

基于概率语义分布的短文本分类

基于隐藏单元条件随机场的多知识源融合改进自动语音识别置信度

多领域系统融合在语音云系统中的应用

利用二重打分方法的激活词语音识别

鉴别性最大后验概率线性回归说话人自适应研究

语音中元音和辅音的听觉感知研究

中文口语理解弱监督训练方法

语音识别中深度神经网络目标值优化

基于卷积神经网络的连续语音识别

基于词矢量相似度的短文本分类

面向语音增强的约束序贯高斯混合模型噪声功率谱估计

基于艺人画像的歌曲点播量预测

传声器阵列波束比判决语音增强方法

HMM-based noise estimator for speech enhancement

基于CNN-SVM和转发树的微博事件情感分析

Acoustic characteristics of stop consonants in fluent reading Chinese Putonghua speech of adult stutterers

A forced alignment approach to detect Chinese repetitive stuttering

汉语连续语音识别系统中三音子模型的优化

ANC次级通道在线建模的辅助噪声控制方法

基于加权有限状态机的动态匹配词图生成算法

基于PLDA的多信道多语音说话人确认研究

高斯PLDA在说话人确认中的应用及其联合估计

汉语语言集外词检索算法的改进研究

基于非负矩阵分解的钢琴多音符估计

卷积神经网络在语音识别中的应用

面向口语统计语言模型建模的自动语料生成算法

基于概率语义分布的短文本分类

传声器阵列波束比判决语音增强方法

小品词在语篇分析中的作用——《纽约时报》反恐语料库中against所揭示的反恐策略

基于概率语义分布的短文本分类

虚拟现实中三维音频关键技术现状及发展

传声器阵列波束比判决语音增强方法

基于概率语义分布的短文本分类

传声器阵列波束比判决语音增强方法

基于概率语义分布的短文本分类

基于艺人画像的歌曲点播量预测

传声器阵列波束比判决语音增强方法

基于CNN-SVM和转发树的微博事件情感分析

基于概率语义分布的短文本分类

基于递归神经网络的语音识别快速解码算法

传声器阵列波束比判决语音增强方法

基于概率语义分布的短文本分类

期刊信息

《网络新媒体技术》
中国科技核心期刊

主管单位:中国科学院
主办单位:中国科学院声学研究所
主编：倪宏
地址：北京海淀区北四环西路21号
邮编：100190
邮箱：xmt@dsp.ac.cn
电话：010-82547906

国际标准刊号：ISSN：2095-347X
国内统一刊号：ISSN：10-1055/TP
邮发代号:2-304

获奖情况:
1990年获海洋出版社优秀期刊奖

国内外数据库收录:
中国中国科技核心期刊

被引量:200