位置:成果数据库 > 期刊 > 期刊详情页
基于最大似然线性回归矩阵的说话人识别算法研究
  • ISSN号:0254-4156
  • 期刊名称:自动化学报
  • 时间:0
  • 页码:1283-1287
  • 语言:中文
  • 分类:TN912[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]清华大学电子工程系,北京100084
  • 相关基金:国家自然科学基金委员会与微软亚洲研究院联合资助项目(60776800);国家高技术研究发展计划(863计划)项目(2006AA010101,2007AA042223,2008AA022414)
  • 相关项目:基于内容的跨语言语音检索方法研究
中文摘要:

研究了基于哼唱的歌曲检索算法,提出了一个完整的哼唱检索框架,由特征提取模块、歌曲模板库模块、旋律匹配模块组成。为改善系统性能,在旋律提取部分采用基于小波变换的基音提取方式。旋律匹配模块在对传统的动态时间弯折进行分析后,对之进行了改进。在548首歌曲的测试集上,该系统的识别效果达到89.1%。

英文摘要:

The methods of QBSH(Query by Singing/Humming) is focused on, and a frame of a complete system, which consists of feature extraction module, MIDI music database, and melody match module, is proposed. In order to improve the system performance, an improved wavelet-based method for pitch track in melody match module and an improved DTW(Dynamic Time Warping) method in melody match module are proposed. The experiment of 548 MIDI songs show that the system performance has a satisfying result.

同期刊论文项目
期刊论文 39 会议论文 21 专利 1
同项目期刊论文
期刊信息
  • 《自动化学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国自动化学会 中国科学院自动化研究所
  • 主编:王飞跃
  • 地址:北京东黄城根北街16号
  • 邮编:100717
  • 邮箱:aas@ia.ac.cn
  • 电话:010-64019820
  • 国际标准刊号:ISSN:0254-4156
  • 国内统一刊号:ISSN:11-2109/TP
  • 邮发代号:2-180
  • 获奖情况:
  • 1997年获全国优秀期刊奖,1985、1990、1996、2000年获中国科学院优秀期刊二等奖,2002年获国家期刊奖
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:27550