基于视听觉信息融合的欠定卷积语音混合信号盲分离及其在机器人听觉系统中应用的研究-东篱科研大数据发现系统（DRDS）

位置：立项数据库 > 立项详情页

基于视听觉信息融合的欠定卷积语音混合信号盲分离及其在机器人听觉系统中应用的研究

项目名称：基于视听觉信息融合的欠定卷积语音混合信号盲分离及其在机器人听觉系统中应用的研究
项目类别：地区科学基金项目
批准号：61162014
申请代码：F010305
项目来源：国家自然科学基金
研究期限：2012-01-01-2015-12-31

项目负责人：张烨
负责人职称：副教授
依托单位：南昌大学
批准年度：2011

中文摘要：

在实际应用中，智能机器人的听觉系统检测到的声音信号往往是多个声源信号及其滤波和延迟信号的混合，为了提高机器听觉系统的语音识别能力，必须采用卷积盲源分离的方法先将源信号从它们的混合信号中分离出来。为满足机器人听觉系统的实际应用需求，使盲源分离算法向实用化发展，本课题在充分研究现有的卷积盲源分离算法的基础上，研究利用视听觉信息融合的方法来解决现有的卷积盲源分离算法在实际应用中存在的问题，如分离信号中的排序和幅度的不确定，欠定卷积混合信号盲分离和移动源混合信号盲分离等问题，使机器听觉系统能自动完成语音混合信号的盲分离，为盲源分离的实用化提供具有理论价值和实际价值的研究成果。

中文主题词：盲源分离；压缩感知；视听觉信息；稀疏表示；

英文摘要：

blind source separation；compressed sensing；audio-visual；sparsity representation；

英文主题词： blind source separation；compressed sensing；audio-visual；sparsity representation；

结论摘要：

本项目在信号分离领域引入了视觉信息，实现了基于视听觉信息融合的双模式盲源分离。研究了基于学习的图像语音信号的稀疏表示及其特征提取的基本方法，并给出了构建视听觉信息融合模型的有效实现方法。利用视觉信息，如声源的位置信息、嘴唇的形态作为辅助信息，研究了消除目前卷积混合盲源分离算法中的排序和幅度不确定问题的方法，为信号盲分离提供了一种双模式的分离方法。课题组已发表学术论文22篇，其中SCI期刊论文9篇，EI论文9篇，授权中国发明专利3项，申请中国发明专利3项，获批5项相关国家级和省级科研项目。

成果综合统计