东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

多反复结构模型的精确音乐分离方法

ISSN号：0371-0025
期刊名称：《声学学报》
时间：0
分类：O241.6[理学—计算数学;理学—数学]
作者机构：重庆邮电大学信号与信息处理重庆市重点实验室,重庆400065
相关基金：国家自然科学基金（61371164,61275099,61102131）、信号与信息处理重庆市市级重点实验室建设项目（CSTC2009CA2003）、重庆市杰出青年基金（csTc2011jjjq40002）、重庆市自然科学基金（csTc2012JJA4D008）、重庆市教育委员会科研项目（KJ120525,KJ130524）和重庆市研究生科研创新项目（CYS14140）资助

关键词：音乐信号, 分离方法, 结构模型, 算法性能, 自适应性, 倒谱系数, 系数矩阵, MFCC, Algorithms, Factorization, Inverse problems, Matrix algebra, Separation, Speech recognition

中文摘要：

针对基本反复模型音乐分离方法自适应性差的问题，提出一种基于美标度倒谱系数（MFCC）的多反复结构模型的音乐分离方法。首先，提取出音乐信号的MFCC系数矩阵（39维的数据构成）；然后利用余弦特性得到其相似矩阵，进而将相似度一致的片段划分到一起，建立不同的反复结构模型；之后结合理想二元掩蔽（IBM）分离出背景音乐及歌声的频谱，相应的时域信号则由傅里叶逆变换获得；最后，在不同类型、长度的音乐文件上测试了算法性能，将提出的算法与Rafii的反复算法和Ozerov的灵活窗非负矩阵分解方法进行对比。实验结果表明，改进方法在分离性能上最高提高3dB左右，并且对于曲调变换大的音乐提高效果更为明显，从而证实了改进方法是一种有效的音乐分离方法，并且更具稳定性。

英文摘要：

For the poor adaptability of the original repeating pattern, an improved music separation method of multirepeating structure of Mel-Frequency Cepstrum Coefficient （MFCC） was proposed. Firstly, the MFCC coefficient matrix （39-dimensional data） of the music signal was extracted; then the cosine characteristic was applied to the count of similarity matrix of MFCC, and putted the fragments with consistent similarity together, next built different repeating patterns for groups with different, thereby the spectrums of the background music and vocal were separated combined with ideal binary masking （IBM）, the corresponding time domain signals were obtained by inverse Fourier transform; finally, the improved method was tested on the music database of different types and length, and the separation results were compared with repeating method of Rafii and the non-negative matrix factorization based on flexible framework method of Ozerov. The experimental results showed that the separation performance of improved method was improved about 3 dB, the performance of music with melody changed larger was significantly improved, thus verifying that that the improved method was an effective music separation algorithm and more

同期刊论文项目

基于人眼固视微动机制的超分辨率红外成像方法与实验研究

期刊论文 41

基于高阶张量的红外弱小目标多特性建模与检测方法研究

期刊论文 45 会议论文 11

复杂调制直接序列扩频信号的盲检测与估计研究

期刊论文 33

同项目期刊论文

Infrared Patch-Image Model for Small Target Detection in a Single Image

自然场景文本区域定位

A block coordinate descent approach for sparse principal component analysis

transmission mechanism based on burst filling in hybrid optical burst/circuit switching networks

OBS网络中一种基于非线性整数规划的多路由机制

一种基于深度图像的手势识别算法

基于非线性映射模型的红外弱小目标图像仿真

基于视觉对比度特性的红外图像超分辨率重建

基于模糊酉矩阵TD-SCDMA突发信号组合码的盲估计

基于NSCT和KFCM聚类的图像边缘检测方法

自适应红外目标跟踪算法

多速率DS／CDMA信号扩频序列并行盲估计方法

基于高阶统计量的OFDM子载波调制识别算法

多进制扩频信号的伪码周期盲估计

多径衰落信道下BOC信号捕获性能分析

一种基于奇异谱的语音激活检测方法

Levy噪声激励下的幂函数型单稳随机共振特性分析

一种新型FM—DCSK保密通信系统

一种新型MIMO-DCSK保密通信系统

基于离散小波变换和离散余弦变换域的扩频水印盲提取算法

新型MU-FM-DCSK保密通信系统

基于改进Rake模型的多径BOC信号精确捕获方法

WCDMA信号检测与参数估计

一种改进型DCSK保密通信系统性能分析

基于多频带谱减法的抗噪声语音识别研究

TETRA与G．729语音编码算法的比较研究

频率选择性衰落信道下OFDM信噪比盲估计

一种新的BOC（n，n）型信号的精确捕获算法

基于小波变换的混合图像EASI盲分离算法

BOC信号的伪码周期和组合码盲估计

基于VSLMS-Rake模型的高阶多径BOC信号捕获方法

一种改进的DCSK保密图像传输方案

一种基于几何谱减法和听觉掩蔽效应的语音增强方法

基于滑动匹配功率谱分析的TD-SCDMA上行突发信号检测

基于锁相环的Duffing振子弱信号时域检测方法研究

基于高阶循环累积量的正交频分复用（OFDM）信号子载波调制识别算法

梯度掺杂对β-FeSi2（n）/c-Si（p）太阳能电池转化效率的影响

基于OpenCV的红外视频测温方法的实现

基于红外测温技术的窑筒体温度数据采集系统的设计

基于自适应模糊PID算法的窑筒体红外测温与制冷的精确控制

多径环境下TDDM-BOC信号伪码周期估计

Music/voice separation based on the multi-repeating structure of Mel cepstrum coefficient

TDDM-BOC信号副载波类型识别及参数盲估计

TDDM-BOC信号组合码序列及信息序列盲估计

并行码相位结合分形重构的TMBOC调制信号捕获算法

BCH码分组交织参数盲识别

基于多频段能量相关排序的语音卷积混合盲源分离

基于独立分量分析的PCMA信号盲分离算法

多速率DS／CDMA信号扩频序列并行盲估计方法

一种新型FM—DCSK保密通信系统

新型MU-FM-DCSK保密通信系统

基于改进Rake模型的多径BOC信号精确捕获方法

BOC信号的伪码周期和组合码盲估计

基于VSLMS-Rake模型的高阶多径BOC信号捕获方法

基于FDM的多进制多用户DCSK

基于LEAP神经网络同步DS—CDMA伪码序列盲估计

带自适应动量因子的变步长盲源分离方法

多径软扩频信号伪码周期盲估计

基于稀疏分解的SFM信号的时频分析方法

窄带干扰环境下的BOC信号捕获

一种改进型多用户正交差分混沌键控

一种线性分组码参数的全盲识别算法

二进制偏移载波及其衍生信号的通用无模糊捕获算法

一种高速差分混沌移位键控系统

一种引入自适应动量项的变步长混沌信号盲分离算法

基于相似度的直扩信号盲解扩方法

基于多尺度Chirplet稀疏分解和Wigner-Ville变换的时频分析方法

基于分块矩阵变换的线性分组码盲识别

Levy噪声中EMD降噪的随机共振研究

多径环境下TDDM-BOC信号伪码周期估计

四相鉴频器辅助的高动态BOC信号载波跟踪

Music/voice separation based on the multi-repeating structure of Mel cepstrum coefficient

TDDM-BOC信号副载波类型识别及参数盲估计

基于自适应惯性权重粒子群优化的多跳频信号盲源分离

TDDM-BOC信号组合码序列及信息序列盲估计

基于迭代列消元法的线性分组码参数盲识别

并行码相位结合分形重构的TMBOC调制信号捕获算法

BCH码分组交织参数盲识别

基于多频段能量相关排序的语音卷积混合盲源分离

基于独立分量分析的PCMA信号盲分离算法

基于视觉对比度特性的红外图像超分辨率重建

自适应红外目标跟踪算法

基于LEAP神经网络同步DS—CDMA伪码序列盲估计

带自适应动量因子的变步长盲源分离方法

基于稀疏分解的SFM信号的时频分析方法

一种引入自适应动量项的变步长混沌信号盲分离算法

基于多尺度Chirplet稀疏分解和Wigner-Ville变换的时频分析方法

Study on infrared image super-resolution reconstruction based on an improved POCS algorithm

基于SOPC的非致冷红外热成像系统的研制

基于图像纹理特征的SIFT算法研究

基于多阈值分割的红外图像伪彩增强算法

基于路径的Retinex算法在红外图像增强中的应用

基于微扫描的红外超分辨率成像系统的设计

基于人眼视觉特性的红外图像增强算法

基于中值滤波和小波变换的红外图像去噪方法

CMOS开关电源中的节能控制器的设计与实现

基于模型化DSP快速设计的音频信号采集系统

基于自适应阈值小波分析的磨音信号去噪

基于Sobel算子和改进SURF算法的图像拼接方法

基于ARM和FPGA的红外系统数据交换驱动设计

梯度掺杂对β-FeSi2（n）/c-Si（p）太阳能电池转化效率的影响

Edge preserving super-resolution infrared image reconstruction based on L1-and L2-norms

基于OpenCV的红外视频测温方法的实现

基于红外测温技术的窑筒体温度数据采集系统的设计

基于自适应模糊PID算法的窑筒体红外测温与制冷的精确控制

Super-resolution reconstruction of images based on uncontrollable microscanning and genetic algorithm

红外高温目标自动追踪系统的设计

基于红外热成像技术的在线扫描测温系统设计

多径环境下TDDM-BOC信号伪码周期估计

四相鉴频器辅助的高动态BOC信号载波跟踪

回转窑筒体表面三维热图像生成方法研究

Music/voice separation based on the multi-repeating structure of Mel cepstrum coefficient

TDDM-BOC信号副载波类型识别及参数盲估计

基于自适应惯性权重粒子群优化的多跳频信号盲源分离

TDDM-BOC信号组合码序列及信息序列盲估计

基于迭代列消元法的线性分组码参数盲识别

期刊信息

《声学学报》
中国科技核心期刊

主管单位:中国科学院
主办单位:中国科学院声学研究所
主编：王小民
地址：北京北四环西路21号
邮编：100190
邮箱：
电话：010-62558329

国际标准刊号：ISSN：0371-0025
国内统一刊号：ISSN：11-2065/O4
邮发代号:2-181

获奖情况:
中国期刊方阵“双效”期刊

国内外数据库收录:
荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,美国应用力学评论,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:8376