位置:成果数据库 > 期刊 > 期刊详情页
基于非负矩阵分解的钢琴多音符估计
  • ISSN号:2095-347X
  • 期刊名称:《网络新媒体技术》
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]中国科学院声学研究所语言声学与内容理解重点实验室,北京100190
  • 相关基金:本论文工作得到国家自然科学基金(批准号:11161140319,91120001,61271426),中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究,编号:XDA06030100,XDA06030500),国家863计划(资助号:2012AA012503),和中科院重点部署项目(编号:KGZD-EW-103-2)经费资助.
中文摘要:

提出了一种基于能量谱包络非负矩阵分解的钢琴多音符估计算法.首先对钢琴88个单音片段进行RTFI时频分析,求得对应平均能量谱,经过时序平均、归一化求得平均能量谱包络,拼接成钢琴的单音能量谱包络基矩阵.之后对测试的多音片段,采用同样处理方法求得多音平均能量谱包络,通过非负矩阵分解求得各音符的权重系数,最后通过阈值限定求得多音符估计结果.性能评估实验基于MAPS数据集的UCHO集和RAND集展开,与MIREX中最好的钢琴音乐自动记谱系统相比,本文提出的钢琴多音符估计算法性能有很大幅度的提升.

英文摘要:

A multiple pitch estimation (MPE) algorithm for piano music was proposed here based on non -negative matrix factorization (NMF) of energy spectrum envelope. Firstly, the average energy spectrums (AES) of 88 piano notes fragments are calculated using Resonator Time - Frequency Image (RTFI). Then the average energy envelopes ( AEE ) are obtained by AES normalization across time. After that, the AEEs are combined to form the average energy envelope basis (AEEB) , which is then used for the NMF of poly- phonic average energy envelope (PAEE). The weight coefficients of piano notes are calculated from the NMF. Finally, the estimation results are obtained by threshold limitation. Performance evaluation experiments were carried out on UCHO and RAND subsets of MAPS database. Compared with the MPE algorithm used in the best AMT system in MIREX, our proposed one outperforms with better performance.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《网络新媒体技术》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院声学研究所
  • 主编:倪宏
  • 地址:北京海淀区北四环西路21号
  • 邮编:100190
  • 邮箱:xmt@dsp.ac.cn
  • 电话:010-82547906
  • 国际标准刊号:ISSN:2095-347X
  • 国内统一刊号:ISSN:10-1055/TP
  • 邮发代号:2-304
  • 获奖情况:
  • 1990年获海洋出版社优秀期刊奖
  • 国内外数据库收录:
  • 中国中国科技核心期刊
  • 被引量:200