基于客观质量评估和音频场景分析语音分离新方法研究-东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：立项数据库 > 立项详情页

基于客观质量评估和音频场景分析语音分离新方法研究

项目名称：基于客观质量评估和音频场景分析语音分离新方法研究
项目类别：重大研究计划
批准号：90820011
申请代码：F030404
项目来源：国家自然科学基金
研究期限：2009-01-01-2011-12-31

项目负责人：刘文举
负责人职称：研究员
依托单位：中国科学院自动化研究所
批准年度：2008

中文摘要：

基于传统滤波器方法为基础的抗噪语音处理方法需要对噪声分布进行估计，要求噪声必需是平稳或准平稳条件下的，无法处理非平稳（例如人声背景）下的噪声问题。基于计算听觉场景分析的语音分离提供了一种解决途径，但目前的现有方法忽略了语音感知质量特性，并且效率也难于满足实用要求，而这种实现方案确实对非平稳噪声的处理提供了一种颇具潜力的解决途径。正是基于此出发点，在分析现有基于计算听觉场景分析语音分离工作优势与不足的基础上，本项研究提出以客观质量评估为指导线索、以计算听觉场景分析为基础的混合语音分离新方法，旨在获得传统方法所不能解决的与非平稳噪音混合时目标语音分离的有效处理手段，使抗噪语音处理提升到一个新高度。本项研究对于数字媒体领域的多媒体检索、声学目标检索、语音增强、鲁棒性语音识别等关键技术具有重要意义和学术价值，并在通信、金融、娱乐、服务、多媒体教学等多项领域应用前景广扩。

中文主题词：音客观质量评估；计算听觉场景分析；语音分离；语音增强；非平稳噪音

结论摘要：

英文主题词Objective Quality Assessment of Speech; Computational Auditory Scene Analysis;Speech Separation;Speech Enhancement;Unstable Noise

成果综合统计

期刊论文
会议论文
专利
获奖
著作

36
22
0
2
0

采用听觉滤波器的宽带MUSIC声源定位方法

Auditory filter based broadband MUSIC algorithm for sound source localization

基于听觉感知特性的信号子空间麦克风阵列语音增强算法

一种改进的单声道混合语音分离方法

Unsupervised Learning of Gaussian Mixture Model with Application to Image Segmentation

From English pitch accent detection to Mandarin stress detection, where is the difference?

Monaural Voiced Speech Segregation Based on Dynamic Harmonic Function

Monaural speech separation based on MAXVQ and CASA for robust speech recognition

汉语大词汇量连续语音识别系统研究进展

融合引导概率的语音识别解码算法研究

Integrating Induced Probability into Decoding for Large Vocabulary Continuous Speech Recognition

基于计算听觉场景分析和语者模型信息的语音识别鲁棒前端研究

基于互补模型的汉语韵律间断自动检测

基于F范数的信号子空间维度估计的多通道语音增强算法

韵律相关的汉语语音识别系统研究

Mandarin stress detection using acoustic, lexical and syntactic features

基于多空间概率分布的汉语连续语音声调识别研究

改进谐波组织规则的单通道浊语音分离系统

基于韵律间断层级的汉语韵律间断分类

Monaural voiced speech segregation based on elaborate harmonic grouping strategies

基于互补模型的汉语重音检测

基于多统计模型和人耳听觉特性的麦克风阵列后滤波语音增强算法

基于声学相关特征与词典语法相关特征的汉语重音检测

会议论文

Masking property based microphone array post-filter design

Learning GMM using elliptically contoured distributions

Speaker adaptation of stochastic segment models using maximum likelihood linear regression

Subspace-based multi-channel speech enhancement using a novel signal subspace dimension estimator in

A novel path extension framework using steady segment detection for mandarin speech recognition

Multi-pitch determination algorithm based on mixture laplacian distribution

Monaural voiced speech segregation based on elaborate harmonic grouping strategy

A Novel Path Extension Framework Using Steady Segment Detection for Mandarin Speech Recognition

Prosody dependent mandarin speech recognition

A novel multi-band spectral subtraction method based on phase modification and magnitude compensatio

Improved Large Vocabulary Mandarin Speech Recognition Using Prosodic and Lexical Information in Maxi

Research on Segment Acoustic Model Based Mandarin LVCSR

HMM-based phonemic distance in different speaking styles and its influence on substitutions in manda

Mandarin pitch accent prediction using hierarchical model based ensemble machine learning

Accelerating Segment Model Decoding for LVCSR by Parallel Processing of Neighboring Segments

Improved Syllable Based Acoustic Modeling by Inter-syllable Transition Model for Continuous Chinese

A novel subspace speech enhancement approach based on test of hypothesis and masking properties

Using prosody to improve Mandarin automatic speech recognition

Mandarin prosodic break detection based on complementary model

Mandarin stress detection using hierarchical model based boosting classification and regression tree

A new language model adaptation framework using modification of structures of background corpus and

An Improvement of HSMM-Based Speech Synthesis by Duration-Dependent State Transition Probabilities

获奖

Improved Syllable Based Acoustic Modeling by Inter-Syllable Transition Model for Continuous Chinese Speech Recognition

Improved Syllable Based Acoustic Modeling by Inter-Syllable Transition Model for Continuous Chinese Speech Recognition

相关项目

虚拟大麦克风阵列的语音增强技术研究

期刊论文 22 会议论文 3

多传感信息融合语音分离和虚拟声合成研究

期刊论文 16 会议论文 8

稳健的麦克风阵列子带域波束形成算法研究

期刊论文 14 会议论文 5

交通语音诱导信息的识别与无人驾驶车辅助行驶路径规划

期刊论文 14 会议论文 19

基于感知信息的语音增强及客观质量评估

期刊论文 8 会议论文 2

基于几何约束张量分解的语音半盲分离方法研究

期刊论文 5 会议论文 8 获奖 2

基于图像视觉分析与人类听觉系统机理的单通道CASA研究

期刊论文 7 会议论文 10

面向自然环境下语音增强的复数域半盲分离方法研究

期刊论文 6 会议论文 15 获奖 6 专利 2 著作 1

基于麦克风阵列的多信道语音增强技术的研究

期刊论文 41 会议论文 1

刘文举的项目

基于段特征分布及听觉机理的抗噪音语音识别方法研究

期刊论文 1

基于环境感知的多通道语音增强优化建模方法及应用

期刊论文 2

基于语音知识和全局最优准则指导的段模型汉语LVCSR方法研究

期刊论文 21 会议论文 25 获奖 2 专利 3

基于数据和模式双驱动CASA语音分离研究

期刊论文 3