基于语音知识和全局最优准则指导的段模型汉语LVCSR方法研究-东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：立项数据库 > 立项详情页

基于语音知识和全局最优准则指导的段模型汉语LVCSR方法研究

项目名称：基于语音知识和全局最优准则指导的段模型汉语LVCSR方法研究
项目类别：面上项目
批准号：60675026
申请代码：F030404
项目来源：国家自然科学基金
研究期限：2007-01-01-2009-12-31

项目负责人：刘文举
负责人职称：研究员
依托单位：中国科学院自动化研究所
批准年度：2006

中文摘要：

深入、系统开展面向语音识别应用的汉语语音知识研究，其中包括探索最适合表征声源PF、发音方式PF和发音位置PF的汉语辅音（声母）APs特征，进而实现汉语辅音的最佳分类，并应用于汉语语音流中声学建模单元Landmarks的标定，提高段模型汉语语音识别声学建模和解码搜索的精度和效率；系统、深入研究全路径模式表征方式的全局最优准则指导的段模型汉语语音识别方法，探索出一条更准确表征语音流发音规律、优于传统优化准则的统计语音识别方法的新途径，使基于段模型语音识别方法无论是在解码搜索、还是在声学建模等方面实现大的跨越，最终的集语音知识和全局最优准则指导的段模型汉语LVCSR系统的误识率比HMM系统至少下降20%，且系统能够达到实时响应。本项研究对于探索语音识别研究的新方法具有重要的学术价值、对于开发出在公众信息服务领域（如通信、金融、娱乐、教育和互联网等）语音识别系统具有良好实用价值和广泛应用前景。

中文主题词：段模型、语音识别、语音知识、全局最优准则、地界标

结论摘要：

英文主题词Segment model;speech recognition;speech knowledge;global optimal criterion;landmarks

成果综合统计

期刊论文
会议论文
专利
获奖
著作

21
25
3
2
0

Robust front-end for speech recognition based on computational auditory scene analysis and speaker m

汉语大词汇量连续语音识别系统研究进展

融合引导概率的语音识别解码算法研究

基于计算听觉场景分析和语者模型信息的语音识别鲁棒前端研究

汉语韵律短语的时长与音高研究

A modified monaural mixture speech separation method

基于高斯-拉普拉斯-伽玛模型和人耳听觉掩蔽效应的信号子空间语音增强算法

Perceptual properties based signal subspace microphone array speech enhancement algorithm

基于F范数的信号子空间维度估计的多通道语音增强算法

韵律相关的汉语语音识别系统研究

改进谐波组织规则的单通道浊语音分离系统

基于韵律间断层级的汉语韵律间断分类

基于多基音跟踪的单声道混合语音分离

基于互补模型的汉语重音检测

基于多统计模型和人耳听觉特性的麦克风阵列后滤波语音增强算法

基于声学相关特征与词典语法相关特征的汉语重音检测

会议论文

An improved a priori MMSE spectral subtraction method for speech

Combining machine learning and computational auditory scene analysis to separate monaural speech of

Context Constrained-Generalized Posterior Probability for Verifying Phone Transcriptions

Harmonics template and application in computational auditory scene analysis for co-channel speech

An effective approach for speech enhancement by multi-band MMSE spectral subtraction

Pitch prediction from MFCC vectors using support vector regression

Microphone array speech enhancement based on a generalized post-filter and a novel perceptual filter

A two-stage algorithm for multi-speaker identification system

Accelerating segment model decoding for lvcsr by parallel processing of neighboring segments

HMM-based phonemic distance in different speaking styles and its influence on substitutions in manda

Monaural voiced speech segregation based on elaborate harmonic grouping strategy

Durational characteristics and pitch characteristics of the prosodic phrase in Mandarin Chinese

AUTOMATIC PROSODY BOUNDARY LABELING OF MANDARIN USING BOTH TEXT AND ACOUSTIC INFORMATION

Microphone array post-filter based on auditory filtering

基于加权相关谱和的多基音检测

Stochastic segment model decoding algorithm based on neighboring segments and its application in LVC

Fast and robust stochastic segment model for mandarin digital string recognition

A novel interpolated n-gram language model based on class hierarchy

An improved a priori MMSE spectral subtraction method for speech enhancement

Research on adaptive step decoding in segment-based LVCSR

An improvement of HSMM-based speech synthesis by duration-dependent state transition probabilities

Research on segment acoustic model based mandarin LVCSR

A new language model adaptation framework using modification of structures of background corpus and

Improved syllable based acoustic modeling by inter-syllable transition model for continuous chinese

Improved large vocabulary Mandarin speech recognition using prosodic and lexical information in maxi

专利

基于多模型和听觉特性的麦克风阵列后滤波语音增强方法

一种模型互补的汉语重音识别方法及系统

基于听觉感知特性的信号子空间麦克风阵列语音增强方法

获奖

Improved Syllable Based Acoustic Modeling by Inter-Syllable Transition Model for Continuous Chinese Speech Recognition

Improved Syllable Based Acoustic Modeling by Inter-Syllable Transition Model for Continuous Chinese Speech Recognition

刘文举的项目

基于客观质量评估和音频场景分析语音分离新方法研究

期刊论文 36 会议论文 22 获奖 2

基于数据和模式双驱动CASA语音分离研究

期刊论文 3

基于段特征分布及听觉机理的抗噪音语音识别方法研究

期刊论文 1

基于环境感知的多通道语音增强优化建模方法及应用

期刊论文 2